一站式网站建设专家

十五年定制化网站建设经验.我们只做有价值的网站

互联网经验

15+

服务客户

2600+

专业团队

30+

如何使用SPSS查看大CSV文件(超过100万行)?

发布时间:2018-03-08 13:49 发布作者:admin 阅读:59
布景:Excel( Excel 2007-2016)最多仅能显示100万(1,048,576)行,那该若何查看跨越100万行的大CSV文件呢?最好的方案是先将CSV文件导进数据库(这是鲲之鹏手艺职员保举的方案),例如MySQL,一旦导进到数据库我们便可以操纵SQL语句很轻松的完成一系列复杂的查询和统计工作,可以说是一劳永逸。可是对非手艺职员来讲,将一个大CSV文件导进MySQL也不是件轻易的事(你可以依照鲲之鹏供给的CSV转MySQL教程完成该操纵:http://www.site-digger.com/html/articles/20120525/34.html)。那有无简单的方案呢?有,那就是利用SPSS。
 
关于SPSS的先容请谷歌之。通俗地说就是一个界面近似Excel,能撑持更多行数、功能壮大的数据统计阐发软件。
下面鲲之鹏的手艺职员将演示若何用SPSS查看一个跨越450万行数据的CSV文件(这是一个公共点评网8个城市的全品类商展数据文件,字符编码是UTF-8)。
1)启动SPSS、设置好字符编码。
因为我们要查看的是UTF-8字符编码的CSV文件,我们需要将“编纂 -> 选项 -> 常规”中“数据和语法的字符编码”设置为Unicode,不然后面中文会显示为乱码。
2)启动“文本导进领导”:
打开 -> 文件 -> 数据,选择我们要查看的CSV文件(提醒:需要将文件类型挑选器选择为*.*,不然你看不到CSV文件)。
3)接下来SPSS会弹出文本导进领导,以下图所示。
提醒:若是在这里你看到的中文是乱码情势的,申明SPSS的字符编码你没设置准确,请参考步调1完成。
“变量名称是不是包括在文件的顶部”选择“是”。
我们导进的是尺度的逗号分隔符文件,分隔符选择“逗号”,文本限制符选择“双引号”。
一向下一步直至点击完成。这是数据导进工作将正式起头。
4)在SPSS的右下角可以查看到及时已导进的数据条数。提醒:在导进未竣事前已导进的数据若是显示为问号(以下图所示),不要担忧,这是正常的,等导进完成绩显示准确了。
5)导进完成。
后以下图所示,总行数跨越了450万行。
6)SPSS数据阐发功能小试牛刀:
统计公共点评上海市各类(按照一级分类统计)商户的散布,成果以下图所示
 

相关资讯