Board logo

標題: [發問] 網頁查詢檔案大小問題 [打印本頁]

作者: lalalada    時間: 2012-8-17 15:21     標題: 網頁查詢檔案大小問題

本帖最後由 lalalada 於 2012-8-17 15:22 編輯

附檔分別是上市櫃的資料
基本上內容只有格式稍有差異
只是一個是以csv檔下載
一個是用插入Web查詢
然後會發現用查詢的檔案明顯大很多!
[attach]12167[/attach][attach]12168[/attach]
因為論壇的限制只能上傳一部分
相當的大小之下可見資料量差很多
完整檔案分別差不多是14~15MB(xlsx)和5MB(csv)
在xls的型式下差距更大為35MB/5MB
請問是什麼導致檔案大小的差異呢? 又有什麼方法可以縮小容量?
應該也不是因為檔案類型的差異(csv/xlsx)
因為我試過將所有的csv檔案合併成xls 也差不多是5MB左右而已
另外xlsx的檔案開啟時間長、而儲存時間超級長
好幾次以為當機就強制關掉... 針對處理時間有辦法改善嗎?
感謝幫忙解惑><
作者: luhpro    時間: 2012-8-19 04:15

本帖最後由 luhpro 於 2012-8-19 04:18 編輯
請問是什麼導致檔案大小的差異呢? 又有什麼方法可以縮小容量?
應該也不是因為檔案類型的差異(csv/xlsx)
lalalada 發表於 2012-8-17 15:21


這當然就是檔案類型差異造成的結果啊,
你可以試著選擇一個較大的Sheet儲存成3種檔案類型,
然後比較其差異大小就可得知.

底下是我直接抓取1402那個Sheet分別儲存成不同檔案格式時的大小比較畫面:
[attach]12184[/attach]

即使是相同的資料在存成不同的檔案格式時,
因為檔案格式的要求會需要多儲存一些其他的資料,
例如 Excel 遇到數字或是日期時可能會需要指定(即非通用)格式:
[attach]12185[/attach]

另外下圖是我將1402那個Sheet下方的資料都刪掉後存出來的檔案大小比較:
[attach]12186[/attach]
我們可以看出其大小差異更多.
至於為什麼會差這麼多,
我猜測是 Excel 需要多儲存一些固定的參數所致.
作者: lalalada    時間: 2012-8-19 12:09

回復 2# luhpro

你好~感謝你的回覆
而且還花時間做了存檔測試!
不過我的疑惑其實是在於內容格式都差不多的資料容量占用不同
[attach]12187[/attach][attach]12188[/attach]
像是這兩個檔案 2498是上市公司 而8069是上櫃
我把資料量都控制在948行 並都存成.xlsx
可是2498的檔案明顯比8069大(50%)
所以才在想是否有可能調整上市公司的檔案使其容量縮小
作者: lalalada    時間: 2012-8-20 02:07

ok!
我想到新的處理方式了
就是把所有的xlsx拆掉存成csv= =!
作者: luhpro    時間: 2012-8-22 21:11

回復  luhpro
像是這兩個檔案 2498是上市公司 而8069是上櫃
我把資料量都控制在948行 並都存成.xlsx
可是2498的檔案明顯比8069大(50%)
lalalada 發表於 2012-8-19 12:09


關於兩個檔案大小差異較大的情形,
看看底下的內容比較圖片或許就可以理解其緣由了:

[attach]12231[/attach]

在你所提供的例子中,
序號、成交價 與 成交股數 都是上市的2498比上櫃的8069數字大,
加上上市又比上櫃多了兩個 淨買賣超,
表頭資料也比上櫃資料多了一些,
會多出那麼多大小似乎也就不是難以想像的情形了.
作者: lalalada    時間: 2012-8-22 22:26

關於兩個檔案大小差異較大的情形,
看看底下的內容比較圖片或許就可以理解其緣由了:



在你所提供 ...
luhpro 發表於 2012-8-22 21:11


看起來好像有點道理@_@
我本來以為每個儲存格的資料是依照其型別決定大小
像是integer/long/string 等等 不過想想這樣沒道理XD




歡迎光臨 麻辣家族討論版版 (http://forum.twbts.com/)