2016年5月1日日曜日

日本経済新聞 2016.05.01 書評



カルチャロミクス;文化をビッグデータで計測する

エレツ エイデン (), ジャン=バティースト ミシェル (), 高安 美佐子 (その他), 阪本 芳久 (翻訳) 草思社 (2016/2/18)ISBN-10: 4794221878

「肉体は悲しい、ああ、私は全ての書物を読んだ」と詠じたのは、十九世紀の詩人マラルメだった。現在では、グーグルがデジタル化した全世界の書籍を、誰でも検索をかけられる状態に近づきつつある。ヒトが本を読み書きすることで成立してきた人文科学は、マシンが数千万冊の書物を高速で「読む」時代にまだ有効なのか。それともこれは、新しい人文科学の時代の始まりなのか。
 本書は、グーグルがデジタル化した、過去、数世紀分、数百万件の書籍から、各年に発行された本に使われている任意の単語・フレーズの使用頻度をグラフ表示する「グーグル・Nグラム・ビューワー」を開発した二人の若い研究者による問題提起の書である。大量の文献をビッグデータとして計測し、ヒトでは見えなかった社会や文化の動態を研究する新しい学問「カルチャロミクス」(文化解析)を提唱している。
 英語の不規則動詞burnの活用はいつからburnt ではなくburnedが多用され始めたのか。言語学者のものだった言語変化の研究が一新する。歴史上の人物はいつからどのように言及頻度が増えて「有名」になる傾向があるのか。検閲と文化との関係はどのように立証されるのか。大量の文献データを一挙に統計処理できるようになると、数理統計的な「文化の法則」に、歴史社会の動態が貫かれていることが分かり、「文化の物理学」も射程に入ってくる。カルチャロミクスは、その後、ニュースメディアやソーシャル・メディアの解析へと急速に拡がり、マーケティングや世論動向の把握、株価予測にも応用が試みられるようになってきた。
 本書が明かしているのは、図書館や歴史文献をめぐる基礎的な研究の取り組みから出発して応用的技術が可能になった経緯である。そもそも、スタンフォード大の図書館計画があって現在の巨大企業グーグルがある。ハーバードを舞台に、人文科学の基礎的研究から産業的応用へといたる展開が、着実にスピーディに組み上げられていくさまが鮮やかに描き出されている。
 他方、哀しいかな、データ不足で、グーグル・Nグラム・ビューアに日本語版はない。これでは、自国の歴史文化のCTスキャン画像が撮れない状態なのである。株価や市場予測に役に立つとなれば色めき立つが、学問の基礎的な部分から始めて、イノベーションを起こそうという発想がこの国にはない。文系学部や人文科学は要らないとか議論しているうちに、これでは世界から取り残されていくばかりだ。