2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【IT】「Python 3.9.13」が公開、シリーズ最後のバグフィックスリリース [田杉山脈★]

44 :名刺は切らしておりまして:2022/05/23(月) 02:27:41 ID:WUh4RWXE.net
>>41
世の中ビッグデータって間違って使われてる
スクレイピングして取ってきたやつはビッグデータじゃない

ビッグデータってのは集めてないのに溜まってるゴミデータのことだ
ある目的のためのシステムを作って使ってる
そのある目的のためのシステムの中に今まで捨てていたデータがある
例えばログ
なんかトラブルあった時のためだけに保管してて
ディスク食うだけでなんもなければ
ひと月過ぎたのはデリートしてたとか

そんな捨ててたデータをちょっと待てよこれもしかしたらあっちのデータと合わせたらなんか傾向が見えるんじゃね的な

そのデリートしてたデータがビッグデータ
容量食うだけで役に立つものじゃなかったデータ
それをふるいにかけたりなんかしたりしたら砂金があるかもしれない
ないかも知れない
そんな大きくてフツーは役に立たないどーでもいい捨てるデータ
それがビッグデータだよ

目的持って集めたデータはビッグデータじゃない

総レス数 100
22 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★