■ このスレッドは過去ログ倉庫に格納されています
【情報技術】古文書の崩し字、あなたも読めます 画像から似た字検索
- 1 :もろ禿HINE! ★@\(^o^)/:2016/03/27(日) 21:25:21.89 ID:CAP_USER.net
- 古文書の崩し字、あなたも読めます 画像から似た字検索 (朝日新聞デジタル) - Yahoo!ニュース
http://headlines.yahoo.co.jp/hl?a=20160327-00000019-asahi-ent
読めない崩し字を解読します――。漢字の画像を入力すると、木簡や古文書の中からよく似た字を探し出してくれるシステムの運用が25日、始まった。奈良文化財研究所と東京大史料編纂(へんさん)所が共同で開発。そうしたシステムは初めてで、研究者だけでなく、一般の人もインターネットで無料活用できる。
両機関はこれまで、漢字入力によって木簡や古文書の文字を検索できる、二つのデータベース(DB)を共同で運用してきた。
今回、それらのDBを援用。知りたい漢字1文字をデジタルカメラで写すなどして画像ファイルにし、ホームページ(HP)の所定欄に入れると、似た漢字の画像と出典、楷書体の漢字が表示される仕組みだ。
収録しているのは、主に奈良時代の木簡の約650字(画像数5166)と、奈良〜江戸時代の手紙や記録、書物などの約5800字(同2万4296)。代表的な漢字を選んだという。
「似ている度合い」を機械的に判断するため、人の目では似ているとは見えない字が示され、判読につながる可能性があるという。例えば、平城京にウリを届けた内容の木簡にあった「丁」に続く文字は長らく判読できなかったが、このシステムを使うと「仕」が示され、雑役を担う「仕丁」の意味らしいとわかったという。
編纂所の井上聡・助教は「古文書の読解に取り組む方々から問い合わせを頂くこともあるが、なかなか応じきれなかった。最先端の研究から趣味まで、広く役立つと思う」と話す。
- 2 :名無しのひみつ@\(^o^)/:2016/03/27(日) 21:34:40.90 ID:CdILmU3Z.net
- 2
- 3 :名無しのひみつ@\(^o^)/:2016/03/27(日) 21:35:46.99 ID:zflKg9bC.net
- うおおおおおおおおおおおおおおおおおおおお
- 4 :名無しのひみつ@\(^o^)/:2016/03/27(日) 21:36:26.55 ID:zflKg9bC.net
- >>1
>知りたい漢字1文字をデジタルカメラで写すなどして画像ファイルにし
はぁ?
自動検知しろよ。つかえねーな
- 5 :名無しのひみつ@\(^o^)/:2016/03/27(日) 21:43:53.25 ID:Q7/Fll+U.net
- 春画展で、書いてある崩し字が読めたら良いのになぁ、と思いながら見てたわ。
- 6 :名無しのひみつ@\(^o^)/:2016/03/27(日) 21:47:57.73 ID:Gf5NyYbW.net
- 前後関係で推測するしかないような字っぽい何かの場合もあるんですが
- 7 :名無しのひみつ@\(^o^)/:2016/03/27(日) 21:59:37.55 ID:M+D07Fgo.net
- ※本当に判読が難しい文字はプロの学者が判読します。
- 8 :名無しのひみつ@\(^o^)/:2016/03/27(日) 22:02:52.00 ID:uHQPhwfF.net
- 毛筆ってすごいよね
古代の人間の
性格とか人格とか
書いてるときの気分とか
その時の湿度とか
書いてある文字の情報以外の情報がいろいろ察しはかれて
情報量がすごい。
- 9 :名無しのひみつ@\(^o^)/:2016/03/27(日) 22:10:08.02 ID:8AW2MsR9.net
- 昔の文字はまったく分からん
漢字なのかひらがななのか
アルファベットのタコみたいなのがずと続く文字も分からん
どうやってよむんだw
- 10 :名無しのひみつ@\(^o^)/:2016/03/27(日) 22:14:59.59 ID:idW6tyVV.net
- へーーーーーーすげえな
- 11 :名無しのひみつ@\(^o^)/:2016/03/27(日) 22:28:29.27 ID:03iLA2gR.net
- 毛筆の文字がつながっていたら(普通は草書体は繫いで書かれます)
ちゃんと切り分けができるのだろうか?
- 12 :名無しのひみつ@\(^o^)/:2016/03/27(日) 22:38:39.63 ID:CE305rFr.net
- 千反田える 天使 美人 可愛い 日本人 飛騨高山 チルタリス 黒髪ロング
- 13 :名無しのひみつ@\(^o^)/:2016/03/27(日) 23:31:00.75 ID:/o3XpPgj.net
- >>9
まともな教育親に施されてたら読めるし、そういう親が少ないから日本人が日本語読めなくなってるんだよね
変態仮名と正漢字崩しただけで読めないって異常なんだよ
戦後最初の文部大臣、安倍能成って腐れ売国奴が、正式な漢字を旧字とかつけて封印したから日本語がぶっ壊された
本人曰く、ごめん間違ってたーで現在まできてる
まともな家は家庭の教育の中で教えてるからね
俺は能の為に強制されただけだが
- 14 :名無しのひみつ@\(^o^)/:2016/03/28(月) 10:00:11.39 ID:mG3Ot2cf.net
- そんなホームページじゃなくて普通にグーグルに
クロールさせときゃいいだろ
- 15 :名無しのひみつ@\(^o^)/:2016/03/28(月) 10:15:41.62 ID:zW/wOKX6.net
- 従来ありそうでなかった画像認識の応用だな
技術的な新しさはどうだか知らないが、そういうDBを作ったことが画期的
- 16 :名無しのひみつ@\(^o^)/:2016/03/28(月) 10:15:55.97 ID:hjYJyoMd.net
- この技術があればOCRなんて100%の識字率が達成できそうなんだが
- 17 :名無しのひみつ@\(^o^)/:2016/03/28(月) 10:24:18.49 ID:7fFnrVaE.net
- 古い毛筆全く読めんよな
- 18 :名無しのひみつ@\(^o^)/:2016/03/28(月) 10:53:28.34 ID:GJbcIVaV.net
- 関係ないけど奈良時代以前は今の五十音て50音じゃなくて80音ぐらいあったらしいな
まだ、漢字を崩して作ったひらがなカタカナが発明される前だから、漢字を使って書いていた・・・
- 19 :名無しのひみつ@\(^o^)/:2016/03/28(月) 10:55:19.10 ID:CUzBs7yi.net
- 川原者が説教垂れてるな
- 20 :名無しのひみつ@\(^o^)/:2016/03/28(月) 11:07:13.14 ID:Ewmu1gTU.net
- >>13
康熙字典体かな?
あれって日本で正式に使われるようになったのは明治からだよw
本国では漢字の意味や発音を調べるための漢字辞典なんだけど
日本では皇帝が作った権威ある書ってことで字自体の見本になっちゃったんだよね
日本人は昔から権威に弱かったんだなってw
個人的には篆刻で使われる篆書体が味があって好きだな
書道やっていて少しだけ勉強したけど昔の字も色々種類あって面白いよね
- 21 :名無しのひみつ@\(^o^)/:2016/03/28(月) 11:33:57.59 ID:3TkoMnn4.net
- 信憑性のある直筆なんてどの位あるんだろうな
- 22 :名無しのひみつ@\(^o^)/:2016/03/28(月) 14:20:17.70 ID:GcI7cfFj.net
- 漢字1文字って、どこからが始まりで1文字の切れ目かなんてわかるやついるのか?
- 23 :名無しのひみつ@\(^o^)/:2016/03/28(月) 19:27:20.60 ID:mxLwCWnL.net
- 使ってみたら候補が沢山あって使い物にならんかった
- 24 :名無しのひみつ@\(^o^)/:2016/03/30(水) 11:38:38.83 ID:TL502aOS.net
- こがおっぱい
- 25 :名無しのひみつ@\(^o^)/:2016/04/02(土) 21:49:35.83 ID:VspE4uys.net
- >>20
康熙帝にとってはいい迷惑だよな
彼は自分の字がクセ字だと思って嫌いだったのに
それを手本にした字体が作られるなんてさw
- 26 :名無しのひみつ@\(^o^)/:2016/04/03(日) 09:36:24.35 ID:b0leXlwh.net
- >>13
漢字の簡体化が間違いなんてことはない
ほぼ歴史の必然だ
仮名遣いについては異論があるのもわかるがな
総レス数 26
7 KB
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★