PHP快速按行读取CSV大文件的封装类分享(也适用于其它超大文本文件)


CSV大文件的读取已经在前面讲述过了(PHP按行读取、处理较大CSV文件的代码实例),但是如何快速完整的操作大文件仍然还存在一些问题。

1、如何快速获取CSV大文件的总行数?

办法一:直接获取文件内容,使用换行符进行拆分得出总行数,这种办法对小文件可行,处理大文件时不可行;
办法二:使用fgets一行一行遍历,得出总行数,这种办法比办法一好一些,但大文件仍有超时的可能;
办法三:借助SplFileObject类,直接将指针定位到文件末尾,通过SplFileObject::key方法获取总行数,这种办法可行,且高效。

具体实现方法:

复制代码 代码如下:

$csv_file = 'path/bigfile.csv';
$spl_object = new SplFileObject($csv_file, 'rb');
$spl_object->seek(filesize($csv_file));
echo $spl_object->key();


2、如何快速获取CSV大文件的数据?

仍然使用PHP的SplFileObject类,通过seek方法实现快速定位。

复制代码 代码如下:

$csv_file = 'path/bigfile.csv';
$start = 100000;  // 从第100000行开始读取
$num = 100;    // 读取100行
$data = array();
$spl_object = new SplFileObject($csv_file, 'rb');
$spl_object->seek($start);
while ($num-- && !$spl_object->eof()) {
 $data[] = $spl_object->fgetcsv();
 $spl_object->next();
}
print_r($data);

3、综合上面两点,整理成一个csv文件读取的类:

复制代码 代码如下:

class CsvReader {
 private $csv_file;
 private $spl_object = null;
 private $error;

 public function __construct($csv_file = '') {
  if($csv_file && file_exists($csv_file)) {
   $this->csv_file = $csv_file;
  }
 }

 public function set_csv_file($csv_file) {
  if(!$csv_file || !file_exists($csv_file)) {
   $this->error = 'File invalid';
   return false;
  }
  $this->csv_file = $csv_file;
  $this->spl_object = null;
 }

 public function get_csv_file() {
  return $this->csv_file;
 }

 private function _file_valid($file = '') {
  $file = $file ? $file : $this->csv_file;
  if(!$file || !file_exists($file)) {
   return false;
  }
  if(!is_readable($file)) {
   return false;
  }
  return true;
 }

 private function _open_file() {
  if(!$this->_file_valid()) {
   $this->error = 'File invalid';
   return false;
  }
  if($this->spl_object == null) {
   $this->spl_object = new SplFileObject($this->csv_file, 'rb');
  }
  return true;
 }

 public function get_data($length = 0, $start = 0) {
  if(!$this->_open_file()) {
   return false;
  }
  $length = $length ? $length : $this->get_lines();
  $start = $start - 1;
  $start = ($start < 0) ? 0 : $start;
  $data = array();
  $this->spl_object->seek($start);
  while ($length-- && !$this->spl_object->eof()) {
   $data[] = $this->spl_object->fgetcsv();
   $this->spl_object->next();
  }
  return $data;
 }

 public function get_lines() {
  if(!$this->_open_file()) {
   return false;
  }
  $this->spl_object->seek(filesize($this->csv_file));
  return $this->spl_object->key();
 }

 public function get_error() {
  return $this->error;
 }
}


调用方法如下:
复制代码 代码如下:

include('CsvReader.class.php');

$csv_file = 'path/bigfile.csv';

$csvreader = new CsvReader($csv_file);

$line_number = $csvreader->get_lines();

$data = $csvreader->get_data(10);

 

echo $line_number, chr(10);

print_r($data);


其实,上述CsvReader类并不只针对CSV大文件,对于其他文本类型的大文件或超大文件同样可用,前提是将类中fgetcsv方法稍加改动为current即可。

 

 



相关阅读:
Linux下touch命令有什么作用如何使用?
使用jQuery实现input数值增量和减量的方法
编写高性能Javascript代码的N条建议
XP/Win7系统电脑蓝屏提示2345port.sys错误的解决方法
不是Win10.1 微软正准备10月Win10 RTM预览版TH2更新
javascript实现的弹出层背景置灰-模拟(easyui dialog)
sql server中判断表或临时表是否存在的方法
Linux下tar命令的简单使用及相关错误解决方法
Nodejs中session的简单使用及通过session实现身份验证的方法
浅谈JavaScript对象与继承
使用mysqldump导入数据和mysqldump增量备份(mysqldump使用方法)
超赞的动手创建JavaScript框架的详细教程
HTML5 CSS3实现一个精美VCD包装盒个性幻灯片案例
jQuery遍历页面所有CheckBox查看是否被选中的方法
快速导航
PHP MySQL HTML CSS JavaScript MSSQL AJAX .NET JSP Linux Mac ASP 服务器 SQL jQuery C# C++ java Android IOS oracle MongoDB SQLite wamp 交通频道 作文范文 有人在追杀我 学前教育专业生求职信 《金瓶梅》读感随记(30) 分享是美德 呼吸之瑟作文200字 下乡书记民情日记 2015办理医社保转移委托书 中国的区域关联与经济增长的空间溢出效应 岁月的吟歌 国企开展创先争优调研会讲话稿 春天,我们去看电影作文1100字 我该如何将你忘记 小学五年级作文450字:祖国在我们心中 幼儿教师随笔:“教养”这事,真得从小培养 2015汉语拼音13教学反思 言之有度 夏,不远了作文150字 金榜题名祝贺词 读《鲁宾逊漂流记》有感1500字 天使de叛逆【一】作文800字 想你的疼 小学小考作文800字:给刘思影同学的一封信 qq个性签名伤感男生繁体字2014 2015高三入团申请书200字 严以用权心得体会:权为民所用 心系民所需 苏轼 《蝶恋花》 三八妇女节——献给母亲的歌 巧治狐狸作文500字 高中高三作文1000字:爱上武侠 一次尝试作文500字 我的美好家园 初中初一作文400字:深夜 读他,懂爱 县无量林产品开发有限公司工作汇报 父亲就这样地离开了我们 小学五年级作文450字:那些风儿 小学六年级作文550字:那个晚上,我深吾父爱 成功女人背后是孤独 没了大地妈妈的小草150字作文 小蜻蜓找朋友 教育局委员会“三严三实”专题教育工作汇报 我要开花给你看作文700字 适合老师看的经典教育随笔 小学四年级作文350字:凡卡后传 文明去哪了? 小学五年级作文800字:给老师的一封信 奔忙 反香烟饮料模拟感觉戒烟协会成立方案 三江小渡 杨万里_ H、拿到了市政府办下发的“尚方宝剑”

Copyright © 2016 phpStudy |