草思社のblog

ノンフィクション書籍を中心とする出版社・草思社のブログ。

【近刊予告】『ビッグデータで文化を計測する―デジタル人文科学の誕生』(仮)

エレツ・アイデン&ジャン-バティスト・ミシェル著

阪本芳久訳

2016年2月発売予定/価格未定

原題:Uncharted: Big Data as a Lens on Human Culture

 

歴史学や語学、文学などの人文科学の研究にも、ビッグデータの波が襲いかかろうとしている!

 Googleがスキャンした大量の書籍(過去、数世紀ぶん!)から、各年に発行された本に使われている単語・フレーズの使用頻度をグラフに示す「グーグル・Nグラム・ビューワー」。この技術の登場で、文献をビッグデータとして活用するまったく新しい人文科学が誕生した。Nグラム・ビューワーを実現に導いたふたりの科学者が、その誕生の経緯と、どのように活用され、何がわかるようになったか、その意義を解説。彼らが「カルチャロミクス」と名づけた、文献をビッグデータとして利用するこの新しい研究を紹介する。

内容より

 不規則変化動詞だった「burnt」はいつから「burned」になったか

 使われている単語のうち、辞書にあるのはどのくらいの割合か

 有名人になるなら、政治家か、俳優か。ビッグデータで検証!

 「天安門」「トロツキー」など検閲により本から消えた言葉を探す

 「ジーンズ」「携帯電話」など新製品の普及のピークは発明から何年後?

 ビッグデータの文化研究・人文科学への応用は何を引き起こすか

 

グーグル・ Nグラム・ビューワーとは

西暦1800年から今世紀初頭までに刊行された合計数百万タイトルの書籍をサンプルに、その中に登場する任意の単語・フレーズの出現頻度を年ごとにプロットする仕組みで、次のURLから誰でも利用できる。https://books.google.com/ngrams 

 たとえば、「Tokyo,Japan,Kyoto」を入力すると、以下のようなグラフが描かれる。

 英語のほかフランス語、ドイツ語、スペイン語、ロシア語、簡体字中国語などに対応している(日本語は対象外)。2010年12月に著者たちがGoogle社のデータを使って実現し、正式サービスとして提供されるようになった。

 

 著者紹介

エレツ・エイデン Erez Aiden

2010年にハーバード大学とマサチューセッツ工科大学(MIT)で博士号取得。数年間、ハーバード大のソサエティ・オブ・フェローズ、Google社の客員研究者をつとめた後、ベイラー医科大学とライス大学の助教に就任し、そこでゲノム・アーキテクチャー・センターを率いた。2009年にはMITテクノロジー・レビュー誌が選ぶTR35(最もイノベーティブな35歳以下の35人)のひとりに選ばれた。2012年には、合衆国政府が若手研究者に与える最高の栄誉であるPECASE賞を、ホワイトハウスより受けた。この賞は、共同研究者と共にゲノムの三次元構造を調べる技術を開発したことに対して与えられたもの。ヒューストン在住。

 

ジャン-バティスト・ミシェル Jean-Baptiste Michel

フランス人、モーリタニア人。科学者、起業家。データ科学企業のクオンティファイド・ラボの創設者。ハーバード大学の準研究員。Google社の客員研究員を務めたこともある。フランスのエコール・ポリテクニークを卒業。2010年にハーバード大学で博士号取得。フォーブス誌が選ぶ「30歳以下の30人」のひとりに選ばれた。ニューヨーク、ブルックリン在住。

 

本書刊行までの10年間、両名はともにビッグデータを使って、人間の文化の研究してきた。その研究成果はネイチャー誌、サイエンス誌、ニューヨークタイムズ紙の特集記事として取り上げられた。彼らが行った講演ビデオは、TED.comで100万回以上の再生を記録している。

 

【著者ふたりによるTEDトーク】