PHP快速按行读取CSV大文件的封装类分享(也适用于其它超大文本文件)


CSV大文件的读取已经在前面讲述过了(PHP按行读取、处理较大CSV文件的代码实例),但是如何快速完整的操作大文件仍然还存在一些问题。

1、如何快速获取CSV大文件的总行数?

办法一:直接获取文件内容,使用换行符进行拆分得出总行数,这种办法对小文件可行,处理大文件时不可行;
办法二:使用fgets一行一行遍历,得出总行数,这种办法比办法一好一些,但大文件仍有超时的可能;
办法三:借助SplFileObject类,直接将指针定位到文件末尾,通过SplFileObject::key方法获取总行数,这种办法可行,且高效。

具体实现方法:

复制代码 代码如下:

$csv_file = 'path/bigfile.csv';
$spl_object = new SplFileObject($csv_file, 'rb');
$spl_object->seek(filesize($csv_file));
echo $spl_object->key();


2、如何快速获取CSV大文件的数据?

仍然使用PHP的SplFileObject类,通过seek方法实现快速定位。

复制代码 代码如下:

$csv_file = 'path/bigfile.csv';
$start = 100000;  // 从第100000行开始读取
$num = 100;    // 读取100行
$data = array();
$spl_object = new SplFileObject($csv_file, 'rb');
$spl_object->seek($start);
while ($num-- && !$spl_object->eof()) {
 $data[] = $spl_object->fgetcsv();
 $spl_object->next();
}
print_r($data);

3、综合上面两点,整理成一个csv文件读取的类:

复制代码 代码如下:

class CsvReader {
 private $csv_file;
 private $spl_object = null;
 private $error;

 public function __construct($csv_file = '') {
  if($csv_file && file_exists($csv_file)) {
   $this->csv_file = $csv_file;
  }
 }

 public function set_csv_file($csv_file) {
  if(!$csv_file || !file_exists($csv_file)) {
   $this->error = 'File invalid';
   return false;
  }
  $this->csv_file = $csv_file;
  $this->spl_object = null;
 }

 public function get_csv_file() {
  return $this->csv_file;
 }

 private function _file_valid($file = '') {
  $file = $file ? $file : $this->csv_file;
  if(!$file || !file_exists($file)) {
   return false;
  }
  if(!is_readable($file)) {
   return false;
  }
  return true;
 }

 private function _open_file() {
  if(!$this->_file_valid()) {
   $this->error = 'File invalid';
   return false;
  }
  if($this->spl_object == null) {
   $this->spl_object = new SplFileObject($this->csv_file, 'rb');
  }
  return true;
 }

 public function get_data($length = 0, $start = 0) {
  if(!$this->_open_file()) {
   return false;
  }
  $length = $length ? $length : $this->get_lines();
  $start = $start - 1;
  $start = ($start < 0) ? 0 : $start;
  $data = array();
  $this->spl_object->seek($start);
  while ($length-- && !$this->spl_object->eof()) {
   $data[] = $this->spl_object->fgetcsv();
   $this->spl_object->next();
  }
  return $data;
 }

 public function get_lines() {
  if(!$this->_open_file()) {
   return false;
  }
  $this->spl_object->seek(filesize($this->csv_file));
  return $this->spl_object->key();
 }

 public function get_error() {
  return $this->error;
 }
}


调用方法如下:
复制代码 代码如下:

include('CsvReader.class.php');

$csv_file = 'path/bigfile.csv';

$csvreader = new CsvReader($csv_file);

$line_number = $csvreader->get_lines();

$data = $csvreader->get_data(10);

 

echo $line_number, chr(10);

print_r($data);


其实,上述CsvReader类并不只针对CSV大文件,对于其他文本类型的大文件或超大文件同样可用,前提是将类中fgetcsv方法稍加改动为current即可。

 

 



相关阅读:
Linux下touch命令有什么作用如何使用?
使用jQuery实现input数值增量和减量的方法
编写高性能Javascript代码的N条建议
XP/Win7系统电脑蓝屏提示2345port.sys错误的解决方法
不是Win10.1 微软正准备10月Win10 RTM预览版TH2更新
javascript实现的弹出层背景置灰-模拟(easyui dialog)
sql server中判断表或临时表是否存在的方法
Linux下tar命令的简单使用及相关错误解决方法
Nodejs中session的简单使用及通过session实现身份验证的方法
浅谈JavaScript对象与继承
使用mysqldump导入数据和mysqldump增量备份(mysqldump使用方法)
超赞的动手创建JavaScript框架的详细教程
HTML5 CSS3实现一个精美VCD包装盒个性幻灯片案例
jQuery遍历页面所有CheckBox查看是否被选中的方法
快速导航
PHP MySQL HTML CSS JavaScript MSSQL AJAX .NET JSP Linux Mac ASP 服务器 SQL jQuery C# C++ java Android IOS oracle MongoDB SQLite wamp 交通频道 作文范文 经典诵读时的感受作文500字 帆船之旅 游达蓬山的作文 介绍好朋友的作文 议论诚信 一个人的成熟 社区工作演讲稿 中国人性的四面镜子 自信的励志故事:一张空头支票 理想 飘 寒】。。。。。。送给了失恋好多天的女生 银行信访工作制度_规章制度 无穷山色,无边往事 职场励志:每天都是试用期 OneIsSuchaBadNumber 忘记你是个伪命题,但我想试试 狗作文700字 小学生写动物作文_俺的宠物“小馒头” 小树叶的秋天400字 一段用名字记录的历史作文1000字 副县长在全县民政工作暨党风廉政建设工作会议上的讲话 老博士猫 话晚秋 自己真的很失败 青春因奥运而精彩550字 幼儿园党支部工作总结 煤矿党委办公室科学发展观心得体会 小学三年级作文300字:Report: Elephants are in Danger 我尝到了“苦头”作文400字 违法校纪校规检讨书 元旦节的小感悟 小学五年级作文450字:话三国 你可以幸福 可以回去的童年--------太平湖之旅散记 我最喜欢的词 还乡河 周五周五 六福村游记450字 国庆节英文祝福短信 四叶的三叶草 妈妈有颗少女心 迎接建党九十周年征文赏析 小学一年级作文300字:我的可恶奶奶 2016年的教师节是几月几日 2017年自愿的离婚协议书范文 小学六年级作文1000字:一次特殊的体验 人人手里攥着一把霾 文章作文500字 三年级关于课余生活的作文200字 成功是短暂的

Copyright © 2016 phpStudy |