2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは

1 :ノチラ ★:2018/03/12(月) 16:59:56.93 ID:CAP_USER.net
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。

取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。

しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。

そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。

さきほどExcelに対してあげた三つの問題点である

・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている

について、Rだとどのように対応しているのかみていきます。

(1)大規模データでも軽快に動く

Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。

対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。

(2)分析手順が残るので、やり直しも簡単

Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。

対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。

(3)最新の分析ツール(アルゴリズム)が使える

Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。

対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570

180 :名刺は切らしておりまして:2018/03/13(火) 09:47:57.99 ID:Kk341+HJ.net
>>165
まともな企業なら同じ規則かそこらに
業務上必須なツールやソフト等々のインストールの申請手続きも決められてるだろ

181 :名刺は切らしておりまして:2018/03/13(火) 10:03:46.27 ID:z74p7W5o.net
>>170
ファイルメーカーも10分いいよ
iPadやiPhone等と連携できるから超強い

182 :名刺は切らしておりまして:2018/03/13(火) 11:22:37.40 ID:22dRceWB.net
Rは統計には便利だが、これからはExcelでデータ作って、Pythonで直接読み込んで辞書形式に変換してからいろいろな処理を加えて、(必要なら)Excelデータにまた書き戻すというやり方が主流になると思う。
ヒューマンインターフェイスとしてはExcelは分かりやすいから、これからも使われ続けるでしょう。

183 :名刺は切らしておりまして:2018/03/13(火) 11:29:03.78 ID:5F5emCFu.net
>>161
R_scr | others
ができないから

184 :名刺は切らしておりまして:2018/03/13(火) 11:38:25.71 ID:ENiZMK0/.net
windowsやらofficeのバージョンアップまじ迷惑 どうせ金儲けのために前の切捨てしてるんだろうけど。
使えるハード資源をみすみすゴミにするようなことはまじでやめてほしい
もう2005年くらいから実質のPCの劇的な進化なんてないはずだろうに・・・・

185 :名刺は切らしておりまして:2018/03/13(火) 12:45:34.70 ID:D6BggZ/1.net
>>182
もうすでにそれです

186 :名刺は切らしておりまして:2018/03/13(火) 12:48:23.70 ID:ccfXaZY7.net
>>184
劇的な退化が去年あっただろ

187 :名刺は切らしておりまして:2018/03/13(火) 12:58:31.85 ID:SZYTUk6j.net
【衝撃】フジテレビ、暴力団と「ズブズブの関係」
http://daily.2ch.net/test/read.cgi/newsplus/1482138859/
https://www.youtube.com/embed/YEGNqOkpPP8?autoplay=1

【テレビ】傷害容疑でフジテレビ社員逮捕 タクシー乗降巡り男性会社員の顔を踏んで外傷性くも膜下出血を負わせた疑い
http://hayabusa9.5ch.net/test/read.cgi/mnewsplus/1508916873/
https://kamome.5ch.net/test/read.cgi/mnewsplus/1314191608/l50

188 :名刺は切らしておりまして:2018/03/13(火) 22:45:48.99 ID:fZSDTuES.net
エクセルで計算とか解析とかしないけど、ワードにはない使い方ができるから
エクセルの方が都合いい時もある。
まあビジネスマンじゃないからどうでもいい

189 :名刺は切らしておりまして:2018/03/13(火) 22:53:40.48 ID:39n19jGR.net
アシストカルクで十分

190 :名刺は切らしておりまして:2018/03/14(水) 06:24:45.68 ID:xc67u97A.net
オープンオフィスがいいと思う人


いないの・・・・・?


印刷できるのに

191 :名刺は切らしておりまして:2018/03/14(水) 08:26:51.65 ID:Tf7F0IFm.net
>>190
良い点は無償なところだけ
家計ぽつけるならそれでもいいけど
人とやり取りするのは無理
計算もクソ遅い

192 :名刺は切らしておりまして:2018/03/14(水) 08:31:27.01 ID:JLyW7f7x.net
検定ならEZR使いやすい

193 :名刺は切らしておりまして:2018/03/14(水) 09:35:08.04 ID:Labh0o2W.net
Rとgnuplotを統合してほしい。
さらにjavaを統合したのがPhythonな気もするが。

194 :名刺は切らしておりまして:2018/03/14(水) 12:23:39.96 ID:w942UkUT.net
オープンソースの方が商用より優れているというガバガバ理論

195 :名刺は切らしておりまして:2018/03/14(水) 16:16:47.20 ID:HFEcSm0Y.net
>>190
オープンオフィスの方が好き
Linuxにもあるし、どのPCでだって使えるから個人でやるなら融通がきいて便利

196 :名刺は切らしておりまして:2018/03/14(水) 16:31:50.40 ID:83at2t/3.net
表計算と統計解析ではニーズもユーザー層も全く別だと思うんだけど。

197 :名刺は切らしておりまして:2018/03/14(水) 20:23:35.54 ID:6nli1zFK.net
Pythonでいいわ

198 :名刺は切らしておりまして:2018/03/14(水) 21:14:24.25 ID:O13Q01WT.net
>>193
ggplot2使えよ。


このスレではRよりもpython派が多いのかな。
Rだとデータ前処理(仕事分析の8割はこれ)にtidyverseが使えるんだけれど、このメリットは考えてない?
dplyr使うと、他の言語で前処理する気がなくなる。

199 :名刺は切らしておりまして:2018/03/14(水) 22:17:06.68 ID:H9yBH59+.net
>>198
ほんこれ。

200 :名刺は切らしておりまして:2018/03/15(木) 20:00:45.63 ID:iuuM6U9X.net
pythonから pyperで必要に応じてRを呼び出せばいい

201 :名刺は切らしておりまして:2018/03/17(土) 20:31:30.60 ID:WtVyYuGo.net
なんでデータベース系ツールや
SQLすっ飛ばして
いきなりRなんだ…

202 :名刺は切らしておりまして:2018/03/17(土) 21:59:46.32 ID:AYn35Zdr.net
>>198
一時期ハマって使ったことあったから「dplyr」懐かしい
パイプだかで繋いで処理が短くなるやつだっけ
Rはデータ整形に便利だけど分析には使わないかな

203 :名刺は切らしておりまして:2018/03/17(土) 22:13:07.36 ID:ykp1WlxK.net
創価学会、在日マフィア、警察による集団ストーカーの一部始終^
(車両ナンバーつき)
https://www.youtube.com/watch?v=gTOBN1AkSz0
https://www.youtube.com/watch?v=bbPcpPwO3ug
https://www.youtube.com/watch?v=de1jeSPGGNo

204 :名刺は切らしておりまして:2018/03/17(土) 22:56:27.86 ID:o7X7gKCq.net
>>201
オフィスユーザーがsqlightでも使うのか???

205 :名刺は切らしておりまして:2018/03/17(土) 23:36:12.73 ID:x0F0YiZ0.net
どうせアホばっかりで忙しくて流し読みしかしないんだからメモ帳で十分。

206 :名刺は切らしておりまして:2018/03/17(土) 23:56:22.84 ID:UgkV9Lfv.net
>>204
Rなんてなおさら使わんだろ
SQL以上に敷居が高いわ

207 :名刺は切らしておりまして:2018/03/18(日) 04:36:53.05 ID:iPkFFf7f.net
HadleyのR for data science
http://r4ds.had.co.nz

208 :名刺は切らしておりまして:2018/03/20(火) 00:21:44.89 ID:j7shvhAJ.net
>>202
今は何使ってんの?

209 :名刺は切らしておりまして:2018/03/20(火) 00:47:06.02 ID:7a4MLRMS.net
Rとか今更感
pythonにしとけ
ど阿呆が書いても読める

210 :名刺は切らしておりまして:2018/03/20(火) 01:28:58.68 ID:dotXIN+D.net
>>45
俺も真っ先にタブローを思い浮かべた
噂でしか知らないけど

211 :名刺は切らしておりまして:2018/03/20(火) 01:30:59.83 ID:nglNaj2K.net
ggplot2と親和性がいい言語がいい

212 :名刺は切らしておりまして:2018/03/20(火) 01:46:48.79 ID:iUJRHTmI.net
USDJPYの1分足スキャルピング型EA(自動売買ツール)とサインツールを開発・公開しております。
興味がありましたら見てみてください。
http://wsedrftgyu1234567890.teamblog.jp/archives/7206121.html

213 :名刺は切らしておりまして:2018/03/20(火) 17:31:34.33 ID:i43vumMJ.net
>>167
線とか矢印の挿入をできるようにしてくれ。

214 :名刺は切らしておりまして:2018/03/20(火) 18:00:24.13 ID:jgI7GOiq.net
>>75
PC版SASもありますよ。

215 :名刺は切らしておりまして:2018/03/20(火) 18:01:43.85 ID:jgI7GOiq.net
>>76
R、SAS、SPSSのデータ入力フロントエンドはエクセルが便利。

216 :名刺は切らしておりまして:2018/03/20(火) 18:02:52.50 ID:jgI7GOiq.net
>>83
データベースに強いのと、統計解析に強いのと、用途が違うとしか言いようが無い。

217 :名刺は切らしておりまして:2018/03/20(火) 18:16:27.70 ID:q+SRLbKt.net
>>216
ならExcelもRと用途違うよね。

218 :名刺は切らしておりまして:2018/03/20(火) 18:22:53.22 ID:jgI7GOiq.net
>>217
同意します。

219 :名刺は切らしておりまして:2018/03/20(火) 18:29:14.84 ID:94ZcApMy.net
時代はLISP
異論は認める

220 :名刺は切らしておりまして:2018/03/20(火) 20:02:08.64 ID:jgI7GOiq.net
ビジネスパーソンのデータ分析ツールのde facto standardはExcellですね。

221 :名刺は切らしておりまして:2018/03/21(水) 11:59:01.28 ID:uNMI26Op.net
>>214
SASはデスクトップの世界では随分前にSPSSに敗退して
エンタープライズの世界の覇者になっていたのでは
今はRやnumpyなんかに押されてる状況かな

222 :名刺は切らしておりまして:2018/03/21(水) 12:00:39.72 ID:uNMI26Op.net
>>217
R方眼紙、あると思います

223 :名刺は切らしておりまして:2018/03/21(水) 12:01:07.70 ID:uNMI26Op.net
>>220
整理計算してるだけで分析はしてないのでは

224 :名刺は切らしておりまして:2018/03/21(水) 12:29:59.23 ID:+VsnROjq.net
ってか、エクセルで問題になるほど大きなデータを扱うビジネスマンって何%を対象にしてドヤ顔してんだよwwwwww

225 :名刺は切らしておりまして:2018/03/21(水) 21:21:02.94 ID:uedntOD8.net
正直、統計解析程度ならソフトは何でも良い。
プログラム作って自動化するまでだから

226 :名刺は切らしておりまして:2018/03/21(水) 21:22:37.82 ID:uedntOD8.net
>>64
今でも健在…

227 :名刺は切らしておりまして:2018/03/22(木) 20:13:23.89 ID:SehxRSdY.net
>>225
フルスクラッチでコード書いてんの?

228 :名刺は切らしておりまして:2018/03/22(木) 20:24:04.60 ID:7tjrcIQ7.net
これから統計などこれらの分野はAIクラウドで自動化の流れ何だろうね

229 :名刺は切らしておりまして:2018/03/22(木) 20:58:43.26 ID:xqbrXTWY.net
>>1
1000万行×400桁って、仮にセルのデータが倍精度浮動小数点数(8バイト/データ)なら、
バイナリデータとして取り込めば、たったの32メガバイトなんだよね。 すべてUnicode文字列で、
全セルの平均文字数が50文字あれば、:3:.2GBになるが。

総レス数 229
44 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★