2016年12月14日 講演・講義の音声から字幕を自動付与 京大教授らが開発、放送大のオンライン授業で活用

京都大学教授らが講演・講義の音声から字幕を付けるシステムを開発し、放送大学が今春開始したオンライン授業の字幕作成で活用されている。多くの講義を配信している放送大では、聴覚障害者などの情報保障のための字幕付与を進めているが、京大教授らが開発したこのシステムは、放送大の講義で概ね9割の認識率を実現。マンパワーで書き起こしを作製するよりも効率的に字幕付与できることが確認された。

 

100%の字幕付与目指す

今年度施行された障害者差別解消法では、障害者の社会的障壁の除去について〝必要かつ合理的な配慮〟を行うことが義務付けられており、聴覚障害者に対しては手話や字幕付与などの情報保障を行うことが、『配慮』に該当する。一方、ここ数年、さまざまな講義コンテンツやインターネット配信が行われているが、字幕が付与されているものはほとんどないのが現状。

放送大学は、わが国で最大のメディアを利用した高等教育機関で、約300科目の講義がテレビやラジオで配信されている。その大半がインターネットでも配信され、スマートフォンやタブレットなどでも視聴可能。現在、字幕が付与されているのはテレビ講義番組の半数程度だが、近い将来100%の字幕付与を目指している。

今年度から、すべての学習をインターネット上の講義や課題解答で行う「オンライン授業」も開設されており、原則的に字幕で付与する方針。この取組は、障害者支援で先進的な米国でも、オンライン学習の字幕は充実しているとはいえない現在、極めて画期的なものといえるが、人的・金銭的なコストが課題となっている。

 

専門用語が課題に

京都大大学院情報学研究科の河原達也教授と同大経済学研究科の秋田祐哉講師らは、自然な話し言葉を対象とした音声認識の研究を進めており、講演・講義に字幕付与を行うシステムを開発した。河原教授らの音声認識技術は、平成23年度から衆議院の会議録システムに導入されており、さらに聴覚障害者のための字幕付与技術に関しても公開シンポジウムを毎年開催。障害者や速記者・要約筆記者などと意見交換やシステムの実証実験を行ってきた。

講演や講義への字幕付与の形態には、その場でリアルタイムに行う場合と、収録した映像に事後的に行う場合がある。前者はリアルタイム性が重視されるのに対して、後者では高い正確性が必要となり、特に大学の講義では、通常の音声認識システムでカバーされていない専門用語が多いことも課題だった。

河原教授らは放送大学の広瀬洋子教授らと連携し、放送大学の講義を対象とした音声認識・字幕付与に関して研究開発を推進。大規模な講演・講義のデータベースを用いて最新の深層学習を導入し、さらに教科書テキストから専門用語などの表現を自動的に登録することで、おおむね90%の認識率を実現した。

 

三分の一以上の時間短縮効果

約30の講義を対象に音声認識結果を編集する場合と人手ですべて書き起こす場合とを比較した結果、システムを用いることで作業時間が短くなることも確認された。具体的には、システムの認識率が87%以上を超えると優位性がみられ、93%になると三分の一以上の時間短縮効果が確認できた。

放送大学では、今年度開始されたオンライン授業の字幕作成に活用。また、インターネット配信によるラジオ講義に字幕と静止画を付与したコンテンツも実験的に配信されている。今後、他の教育機関で作成されるさまざまな講義コンテンツに対する字幕付与への展開が期待される。


株式会社官庁通信社
〒101-0041 東京都千代田区神田須田町2-13-14
--総務部--TEL 03-3251-5751 FAX 03-3251-5753
--編集部--TEL 03-3251-5755 FAX 03-3251-5754

Copyright 株式会社官庁通信社 All Rights Reserved.