找回密码
 注册

QQ登录

快捷登录

新浪微博登陆

搜索
CDD 法语助手

求教数据应用方法,在线等!

12
回复
1197
查看
[ 复制链接 ]
头像被屏蔽

新浪微博达人勋

提示: 该帖被管理员或版主屏蔽
2009-5-21 17:03:34

新浪微博达人勋

你这个要用Excel来做是不靠谱的,因为数据量太大了。

其实你的这个东西要求并不是很高,主要就是通过各种数据生成一个报表。
根据你的数据量来看,每个尺寸有5*365*24=43800条记录。

300个产品和30个测量数据。个人建议你可以用PostgresSQL或者MS SQL Server,要用MySQL也可以。有条件可以上Oracle。

其次要考虑如何将数据导入到数据库,其实这个过程还是很简单的,你主要是要分析txt文件格式,然后写入数据库。这个可以用Java, PHP, Python,C#等语言实现。要看你的平台决定。要是将来条件许可你可以把生成数据的程序重写一下,改成直接写入数据库。

最后就是要如何生成报表了,比较简单的方式是用PHP等语言生成Web报表。也可以用.Net生成报表。

总而言之,你工作分成两部分,首先要把数据读入数据库,其次从数据库里读数据里生成报表。

这个工作还不是很复杂,一般计算机专业的人都能做。
2009-5-21 18:10:29

使用道具 举报

新浪微博达人勋

lz到这里来了
我的思路是这样,先明白如何应用统计函数找到需要的值,明白了以后,先处理某一个产品
一个会弄了,300个产品也就会了,就是重复工作

建议,如果数据量很大本身又没有什么顺序,建议用数据库处理,excel有行数限制,用数据库基本没有这个限制而且数据处理速度也快

因为不知道总的数据量,如果用Excel,倒入后排序,然后编写简单的Macro处理数据,其实主要功能就是在一个大的循环里:找到需要处理的数据的范围,应用函数然后记录结果。虽然肯定比处理单个产品要费一点时间,但肯定比手工作300个产品来的快
如果用数据库,导入后,或者用存储过程直接做类似上面的操作,或者排序后分部分导入Excel进行处理(如果lz喜欢用Excel但是数据量又很大的话)

得到结果以后的比较和生产能力调整等等,就要看你们单位的具体情况了
2009-5-21 18:19:27

使用道具 举报

新浪微博达人勋

谢谢楼上的回复,我现在正在手动的把每个txt文件导入到相对应的Excel文件中,这样有N多个,又没有什么办法让所有txt文件自动导入到Excel中并自己运行计算公式的。 打算这些做完后,吧excel再导入到数据库中,做窗口,生成报表,这么一来整个成手动的了,又没有什么简便方法啊。我也不是计算机专业的,你前面说的那些从来没有用过啊。
2009-5-21 18:32:31

使用道具 举报

新浪微博达人勋

根据不同的文件格式,数据量有不同的办法,比如说数据结构都一样(每行30个数据比如),相对会容易一点
因为我以前用数据库比较多,在这种情况下,建立一个数据传输服务,然后用文件名作为参数调用就是了,
(大概方法是建立带参数的DTS服务,然后建立一个包含所有文件名的表格,用存储过程遍历该表并调用DTS)而且格式的后期处理排序也方便的很,lz可以在单位找一个对数据库比较了解人帮助一下或是在网上查找

用excel的话,可能不一定有批量处理功能,要么你可以先把文件连接起来变成一个大文件再导入(简单的用winrar比如说),或是写vb代码导入,不过可能要做一些格式方面的处理,而且我估计由于文件数目众多速度会很慢
2009-5-21 19:09:25

使用道具 举报

新浪微博达人勋

只是算算误差的最大值, 最小值 和标准差
PERL/Python 是最适合这类杂活的, 而且数据源都是txt

啥 Web, JAVA, 根本就不适合干这种活
数据库什么的, 先要导入数据, 还要再写程序去处理. 为了算个标准差没必要搞那么复杂
2009-5-21 19:22:44

使用道具 举报

新浪微博达人勋

那倒也是,楼主可以试试看,用脚本直接把需要的数据找出来然后计算就好了

我是一直绕在excel里了,呵呵
2009-5-21 19:38:48

使用道具 举报

新浪微博达人勋

谢谢楼上几位高手的回复,总结一下,首先学会Python,看看如何用脚本找数据,再试着全部导入ACCESS,准备做报表。 拼了~~!!
大家谁还有什么方法,还有什么建议,都往这里写啊,谢谢大家了
2009-5-21 20:19:26

使用道具 举报

新浪微博达人勋

5年, 就算每年 52周工作, 每周 40小时, 这也才 10400小时
也就是说如果每个产品的30组数据用";"分开存在同一个txt文件里的话
每个产品的txt文件也才1万行出个头, 这么点数据, 根本就没必要上数据库

如果不是计算机专业的, 建议excel, 才1W行excel绝对足够了
我开过一个18W行的csv, 也能显示6W多
数据导入很简单, 如果txt文件是";"隔开的数据, 直接改名.csv, 用excel就开了
如果不是, 倒是有点麻烦, 需要用sed, awk之类的东西处理一下
先做一个产品的, 剩下299个, 依样画葫芦
需要持久化储存的就用excel导入Access

匆忙之间没看清楼主的数据量, 误导了, 不好意思
2009-5-21 20:46:59

使用道具 举报

新浪微博达人勋

谢谢楼上,最后还得用到ACCESS
2009-5-21 22:40:33

使用道具 举报

新浪微博达人勋

以前弄过,用Java控制ACCESS数据库。掺点儿VBA,SQL。
2009-5-21 22:55:38

使用道具 举报

新浪微博达人勋

谢谢楼上,有什么建议都往这里写啊
2009-5-22 11:11:37

使用道具 举报

新浪微博达人勋

非得导到Excel里面去啊?就是数据量大点,数据结构很简单,随便用个什么语言写个程序读取一下计算计算就OK了。C、Java、Python随你挑,用什么语言都可以,性能有点差异而已,不是非得为了这去学个别的语言。

其实你可以给你的客户proposer一下,一年就archiver一次,05年的平均误差多少,06年平均误差多少,这5-6年,10来年统计一次的,谁受得了。程序大量的时间不是花在计算上,而是花在读取目录文件列表和打开、关闭文件上面了。
2009-5-22 11:25:22

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 新浪微博登陆

本版积分规则

返回顶部