2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【情報技術】暗号化したままデータを分類できるビッグデータ向け解析技術を開発

1 :もろ禿HINE! ★@\(^o^)/:2016/01/15(金) 21:59:56.10 ID:CAP_USER.net
【プレスリリース】暗号化したままデータを分類できるビッグデータ向け解析技術を開発 - 日本の研究.com
https://research-er.jp/articles/view/42398


ポイント

•ビッグデータ解析で多用されているロジスティック回帰分析をデータ暗号化のまま計算可能に
•暗号化された1億件のデータを30分以内で複数グループに分類できることをシミュレーションで確認
•ビッグデータ解析におけるプライバシー保護への応用に期待


NICT セキュリティ基盤研究室は、大量のデータを暗号化したまま複数のグループに分類できるビッグデータ向け解析技術を開発しました。

本技術は、NICTが開発していた準同型暗号技術SPHERE(スフィア)とロジスティック回帰分析技術を組み合わせることで実現したものです。
暗号化した状態でデータを分類できるので、個人情報などの機微な情報を安全に効率よく分類することが可能になります。
応用例の一つとして、本技術を用いて健康診断等のデータから病気の判定を行う際に、データ処理を行う第三者にデータの内容を開示せずに済み、
プライバシーを保護できるようになると期待されます。


(以下略)

2 :名無しのひみつ@\(^o^)/:2016/01/15(金) 22:00:23.75 ID:AD9uVSI9.net
「裸の写真を送って」と頼まれた女性がアップしたのは...その手があったか!(画像)
https://t.co/RA0dTRyIf8

128

3 :名無しのひみつ@\(^o^)/:2016/01/15(金) 22:21:31.37 ID:YncZdTiG.net
暗号化したままのデータを読み取る技術ももうすぐだな

4 :名無しのひみつ@\(^o^)/:2016/01/15(金) 22:22:47.99 ID:ZR1RLLli.net
まさか暗号化されてない付加タグで分類とかじゃないだろうなw

5 :名無しのひみつ@\(^o^)/:2016/01/15(金) 22:28:30.64 ID:vzjx2COR.net
暗号って、パターンを読めないから暗号なのでは?

6 :名無しのひみつ@\(^o^)/:2016/01/15(金) 22:44:05.82 ID:b58HzkHk.net
データコピー取ってそっちデコードしてるとかじゃないの?

7 :名無しのひみつ@\(^o^)/:2016/01/15(金) 23:02:06.50 ID:dcWNIecs.net
辞書(平文)を用意して、暗号文と同時に細かく分類すれば事実上なんでも解読できる
新しい暗号解読法として特許出願予定

8 :名無しのひみつ@\(^o^)/:2016/01/15(金) 23:28:17.91 ID:n5szUdZU.net
エンクリプトした文字列をソートして行数を数えてみましたって話か?

9 :名無しのひみつ@\(^o^)/:2016/01/15(金) 23:46:27.85 ID:IFF7IAdF.net
暗号化されたエロビデオが再生できれば問題ない。

10 :名無しのひみつ@\(^o^)/:2016/01/15(金) 23:53:20.77 ID:uiHfDLZN.net
そんなことより伊原摩耶花ってあざとくてうざくない?
ああいう猿みたいなゴキブリ野郎は嫌いなんだよね
古典部シリーズから消えてくれないかな

11 :名無しのひみつ@\(^o^)/:2016/01/15(金) 23:53:27.58 ID:dcWNIecs.net
プレスリリース
http://www.nict.go.jp/press/2016/01/14-1.html

12 :名無しのひみつ@\(^o^)/:2016/01/15(金) 23:59:25.63 ID:dcWNIecs.net
768人分のデータの576件を学習に使って
残りの192件を分析したら
平文でも暗号文でも正答率約80%(ただし、誤答の判定対象が同じかどうかは不明みたい)

ビッグデータがどこに出てくるのかと思ったら
>シミュレーションによって、サーバ上で1億件のデータを30分以内で分析可能であることが確認できました(図3参照)
だそうだ

13 :名無しのひみつ@\(^o^)/:2016/01/16(土) 01:49:00.02 ID:FgjRzvja.net
>>12
つまりグループAやらBの内容はともかく、
暗号化したままデータを分類出来るって事か?
せっかくエントロピー最大化して暗号化したのに、意味無くなるね。

14 :名無しのひみつ@\(^o^)/:2016/01/16(土) 06:57:24.11 ID:6J0mZyu/.net
暗号文が新たな平文になるになるだけだろ

15 :名無しのひみつ@\(^o^)/:2016/01/16(土) 09:15:42.75 ID:lxLvt3xg.net
たとえば、1を「桜散る」と暗号化し、
2を「ニイタカヤマノボレ」と暗号化し、
3を「花子さんが子供を産んだ」と暗号化したとすれば、
分類はできる。しかし、「桜散る」がどういうことを
表わした暗号なのかはわからないままだ。
 しかし、結果的に頻度の分析から、少しの情報が
漏れる。たとえば頻出する英字はEであるというような。
頻度の少ない事象の連絡は重要事項なんだろうと想像できるなど。

16 :名無しのひみつ@\(^o^)/:2016/01/16(土) 09:35:53.19 ID:dzKGYOm4.net
これまで「計算に膨大な時間がかかる」っていうのが今ひとつピンとこなかったんだけど、
最近サーバーをいじるようになってきて漸くそれが理解できるようになってきた。

17 :名無しのひみつ@\(^o^)/:2016/01/16(土) 10:49:43.67 ID:GR+yOXqZ.net
下水からだれのうんこかわかるって
ことなんでしょ

18 :名無しのひみつ@\(^o^)/:2016/01/16(土) 11:12:48.81 ID:vNxREotz.net
準同型性を保持する演算しか使えない
まだ加法と乗法を同時に満足する体系は見つかってない
つまり加法しか出来ないと考えていい
条件満たす総数計算したり
計算すると総数を暗号化したものが得られるので
それを復号すればいい

19 :名無しのひみつ@\(^o^)/:2016/01/16(土) 11:59:30.35 ID:N1E1m7x7.net
格子暗号なら出来る。量子コンピュータによる解読にも耐えうる。

20 :名無しのひみつ@\(^o^)/:2016/01/16(土) 12:35:01.87 ID:lbHeZ/S+.net
分類するからには一瞬の間だけでも復号してるんだろ

21 :名無しのひみつ@\(^o^)/:2016/01/16(土) 12:35:08.85 ID:YDdueqWx.net
>>18
http://www.atmarkit.co.jp/ait/articles/1508/14/news001_2.html
>しかし、「加法と乗法の両方を同時に実現する」準同型暗号は
>長らく実現していませんでした。そのような暗号を
>「完全準同型暗号(FHE:Fully HE)」といいます。

https://research-er.jp/articles/view/42398
>データをあらかじめ完全準同型暗号技術を用いて暗号化しておき、
>(省略) 理論的には可能ですが、それには膨大な時間を要するため、
>現実的な時間で大量のデータを処理することは困難でした
>
>今回開発した技術の概要
>既存の手法(ロジスティック回帰分析アルゴリズムと
>完全準同型暗号の単純な組み合わせ)に対して、
>以下に説明する2つの高速化技術を適用しました。
>1.ロジスティック関数の2次関数による近似
>2.データ提供者側での事前計算による暗号データ計算の軽減

完全準同型暗号は実現しているが、実用にならないほど遅い
そこで「近似」ながら現実的な時間で処理出来る高速化技術を開発しました
ということみたい

22 :名無しのひみつ@\(^o^)/:2016/01/16(土) 12:40:49.85 ID:YDdueqWx.net
>>20
暗号化したまま計算する「準同型暗号」
http://www.atmarkit.co.jp/ait/articles/1508/14/news001.html

23 :名無しのひみつ@\(^o^)/:2016/01/16(土) 13:00:13.67 ID:rXoFIEhk.net
まるで神様とおまいらさんの関係のようだな。
個体は識別できても心の中身はさっぱりわからん。

24 :名無しのひみつ@\(^o^)/:2016/01/16(土) 14:04:34.27 ID:O26ZDKDH.net
>>21
正答率の76%(77%)やら80%(80%)が高いのか低いのか分からんけど
高速化したけど厳密じゃなくなったからビッグデータの解析みたいなあたりさわりのない処理にしか使えない
ってことかな

25 :名無しのひみつ@\(^o^)/:2016/01/16(土) 14:29:29.46 ID:Upq0BLNh.net
これは暗号といえるのか?
線形代数的に考えると 同じだけど別の線形空間に変換しただけだろ?

26 :名無しのひみつ@\(^o^)/:2016/01/16(土) 15:19:30.27 ID:YDdueqWx.net
>>24
むしろビッグデータだからこそ高速化の必要性が出てきて開発したという話かと

27 :名無しのひみつ@\(^o^)/:2016/01/16(土) 15:50:58.56 ID:3FG581cx.net
その技術でモザイクを何とかしてくれ。

28 :名無しのひみつ@\(^o^)/:2016/01/16(土) 16:54:34.74 ID:ZbMaXSsX.net
模範解答を暗号化し
それに近い値を分類とかじゃないよね。
4択の回答とか。回答の範囲が絞らてるとか。

29 :名無しのひみつ@\(^o^)/:2016/01/17(日) 01:29:40.95 ID:b2QIswF2.net
暗号化関数F(x)がユニークであれば、
データを暗号化しようと同類のデータには、その特徴が残っている。

30 :名無しのひみつ@\(^o^)/:2016/01/17(日) 15:05:42.89 ID:oQp+rRG+.net
>>26
1億件は実はたいした件数ではない(全国のコンビニ約5万店×2000件)
条件を変えて何回もやるとしんどそう

31 :名無しのひみつ@\(^o^)/:2016/01/17(日) 15:08:24.98 ID:+CT3qXPo.net
準同型暗号が意味あるのは、何百桁もの数字を扱いその和とか積とかを暗号化したまま計算したい時

月給のような桁数の少ない数字だと、辞書作れば暗号解読終わりだからな

しかし、そんな数字が個々人に割り当てられたデータなんて実際には存在しねー

文字列を文字コードを連ねた数字だと思っても、その和とか積には意味ないし

32 :名無しのひみつ@\(^o^)/:2016/01/17(日) 15:35:09.62 ID:K0WVjta0.net
>>26
単に高速化できるだけでなく、個人情報を扱うのに比べて緩いセキュリティのコンピュータを使える
クラウドなんかも使いやすいと思う
これはコストに大きく影響する

33 :名無しのひみつ@\(^o^)/:2016/01/17(日) 16:01:57.30 ID:k1a5Ibv5.net
>>31
鍵無いのにどうやって辞書作るの?

>>30
https://research-er.jp/articles/view/42398
>現実的な時間で大量のデータを処理することは困難でした

「1億件×暗号化したまま計算するコスト」だよ

34 :名無しのひみつ@\(^o^)/:2016/01/17(日) 16:03:36.39 ID:k1a5Ibv5.net
>>30
ああごめんビッグデータじゃないって意味か
それはそうだね

35 :名無しのひみつ@\(^o^)/:2016/01/17(日) 16:24:31.56 ID:oQp+rRG+.net
プレスリリースの
>768人分の糖尿病に関するデータを用いた実験結果を図6に示します。
>最初の576件のデータから、オリジナルの関数を用いてデータを暗号化せずに学習した結果が赤い直線で

というのは辞書を作っていることに相当するのではあるまいか

36 :名無しのひみつ@\(^o^)/:2016/01/17(日) 16:26:14.07 ID:LgOAjW+p.net
暗号弱くね?
弱い部分と強い部分持たせるんだろうけど、
何にしても意味無いよね。。

37 :名無しのひみつ@\(^o^)/:2016/01/17(日) 16:31:41.41 ID:k1a5Ibv5.net
>>35
それは今回の技術を評価するための比較用だから関係無いと思うけど
実運用時はサーバー上に暗号化してないデータは無いんだし

38 :名無しのひみつ@\(^o^)/:2016/01/17(日) 21:36:09.58 ID:04/mAW8Q.net
>>33
>鍵無いのにどうやって辞書作るの?

平文と暗号文のペアから作るんだけど?

十分多くの平文と暗号文のペアがあれば、ほぼ網羅的な辞書作れるよ

39 :名無しのひみつ@\(^o^)/:2016/01/17(日) 21:41:39.35 ID:04/mAW8Q.net
>>36
暗号の弱さよりも、暗号化されたデータに対して適用できる演算の少なさが問題

スレタイの「データを分類」とか不可能なんで、「データを分析」の間違いだわな

40 :名無しのひみつ@\(^o^)/:2016/01/17(日) 22:27:50.98 ID:WWAR1qrV.net
>>25
俺もそんな気がする。
意味あんのかね。

41 :名無しのひみつ@\(^o^)/:2016/01/18(月) 01:51:17.50 ID:VN7YaiFt.net
>>36
勝手な想像でケチ付ける前に「準同型」について理解しような
辞書的な意味を知っただけで十分だと思うなよ
大学レベルの数学を習っていれば当たり前の概念だ

42 :名無しのひみつ@\(^o^)/:2016/01/18(月) 08:20:23.96 ID:VISLrgrE.net
>>38
意味が分からない
暗号鍵無いのにどうやってペア作るの?
サーバー上には顧客が暗号化したデータしか無いのに

43 :名無しのひみつ@\(^o^)/:2016/01/18(月) 08:34:09.95 ID:9WbMEM/s.net
>応用例の一つとして、本技術を用いて健康診断等のデータから病気の判定を行う際に、データ処理を行う第三者にデータの内容を開示せずに済み、

これ、検査値とその基準値との大小比較がいるから順序保存されてないと無理だよな

しかも、検査値が二桁や三桁なら全部の暗号化結果を網羅することはたやすい

ってことで大嘘

44 :名無しのひみつ@\(^o^)/:2016/01/18(月) 08:56:28.68 ID:VISLrgrE.net
>>43
分かり辛い書き方だとは思うけどその「データ処理を行う第三者」は
クラウドサーバー管理者(計算資源提供者)のこと

基準値を設定する分析側はそもそも元のデータも持ってる

>今回の成果
>本技術を用いることで、クラウドサーバ等を用いてデータの分類を行う際、
>データに含まれるプライバシー情報が
>サーバ管理者に漏えいすることを防ぐことができます。

45 :名無しのひみつ@\(^o^)/:2016/01/18(月) 09:16:35.45 ID:UGfGeQli.net
>>42
はあ?
知識不足ですよ

46 :名無しのひみつ@\(^o^)/:2016/01/18(月) 09:32:13.20 ID:9WbMEM/s.net
>>44
>基準値を設定する分析側はそもそも元のデータも持ってる

「データ処理を行う第三者にデータの内容を開示せず」の「データ処理」が「分析」なのに、お前馬鹿だな

47 :名無しのひみつ@\(^o^)/:2016/01/18(月) 09:34:37.50 ID:WtvWicnJ.net
>>39
NICTに文句言え

48 :名無しのひみつ@\(^o^)/:2016/01/18(月) 09:37:19.25 ID:VISLrgrE.net
>>45-46
>>1のリンク先ちゃんと読んでからレスしてくれ
どこぞのスレタイ速報じゃないんだから

49 :名無しのひみつ@\(^o^)/:2016/01/18(月) 10:48:39.35 ID:9WbMEM/s.net
>>48
リンク先を書いた奴が暗号化のこと何もわかってないんだから、読むだけ無駄だし、

>応用例の一つとして、本技術を用いて健康診断等のデータから病気の判定を行う

は、リンク先で話題にしてる回帰分析じゃねーし

そういったこともわからんお前って、、、

50 :名無しのひみつ@\(^o^)/:2016/01/18(月) 13:21:22.03 ID:VISLrgrE.net
>>49
書いたのはNICTだけど「NICT=暗号化のこと何もわかってない」と言える程の人なら
俺から暗号についてこれ以上言うことは無いかな
NICTにこの技術にはセキュリティに問題があると指導してあげてくれ
http://www.nict.go.jp/press/2016/01/14-1.html

>リンク先で話題にしてる回帰分析じゃねーし
ということは「今回の成果」の内容や「性能評価」の糖尿病判定と
食い違う内容が同じ記事の概要に書いてあるってこと?
俺にはそう見えないけど、そう思うならNICTに指摘してあげてくれ

51 :名無しのひみつ@\(^o^)/:2016/01/18(月) 13:30:38.02 ID:9WbMEM/s.net
馬鹿ほど、長文書くな

52 :名無しのひみつ@\(^o^)/:2016/01/18(月) 13:44:36.49 ID:tbkULzjO.net
それって暗号化の方式にもよるんじゃないか?
てか暗号化になってないんじゃ荷か?

53 :名無しのひみつ@\(^o^)/:2016/01/18(月) 14:00:28.78 ID:VISLrgrE.net
案の定レッテル貼りだけになった

54 :名無しのひみつ@\(^o^)/:2016/01/18(月) 14:03:40.10 ID:4xmR4IYR.net
NSAが興味を持ったようです

55 :名無しのひみつ@\(^o^)/:2016/01/18(月) 15:37:38.08 ID:aYIkeDvo.net
>>3 …釣れますか?
>>15 判りやすい。

56 :名無しのひみつ@\(^o^)/:2016/01/18(月) 17:38:56.53 ID:9WbMEM/s.net
>>53
お前が長々書いたことを要約してやると「俺は暗号には無知で回帰分析が何かも知らないけど、
NICTが発表したんだから凄いことに違いない」ってこった、馬鹿は小保方でも応援してろ

57 :名無しのひみつ@\(^o^)/:2016/01/18(月) 18:11:09.75 ID:VISLrgrE.net
>>56
俺が言っているのは「勘違いしてるよ」って話なんだけど
強力な脳内フィルターをお持ちのようで

58 :名無しのひみつ@\(^o^)/:2016/01/18(月) 18:12:48.96 ID:VISLrgrE.net
>>56
都合よく指摘がスルーされたから、あたらめて書き直そうか

「応用例の〜」「サーバ管理者に〜」「糖尿病であるか〜」
これらは同じ記事の中にあるものでリンク先云々で分離されるものではない

上記の勘違いにより「データ処理」が「分析」のことだと思い込んでいる
記事の「背景」の項すら読んでいないことは明白

59 :名無しのひみつ@\(^o^)/:2016/01/18(月) 19:14:49.49 ID:9WbMEM/s.net
「俺は暗号には無知で回帰分析が何かも知らない」で済む話を、また長文で、、、

60 :名無しのひみつ@\(^o^)/:2016/01/18(月) 20:04:40.38 ID:VISLrgrE.net
>>51 >>56 >>59
同じレッテル貼りを繰り返すだけとは哀れだな

61 :名無しのひみつ@\(^o^)/:2016/01/18(月) 20:19:45.42 ID:9WbMEM/s.net
「馬鹿ほど、長文書くな」と馬鹿にされても、中身のない長文書きを繰り返すしか能のない馬鹿wwwwwwwwwwwwwwwww

62 :名無しのひみつ@\(^o^)/:2016/01/19(火) 05:07:54.78 ID:Kzc9xXIx.net
素人だけど、それじゃあ暗号の意味がないような気がする

総レス数 62
18 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★