講演・講義の音声から字幕を自動付与　京大教授らが開発、放送大のオンライン授業で活用

HOME » 今日の話題 » 講演・講義の音声から字幕を自動付与　京大教授らが開発、放送大のオンライン授業で活用

2016年12月14日講演・講義の音声から字幕を自動付与　京大教授らが開発、放送大のオンライン授業で活用

京都大学教授らが講演・講義の音声から字幕を付けるシステムを開発し、放送大学が今春開始したオンライン授業の字幕作成で活用されている。多くの講義を配信している放送大では、聴覚障害者などの情報保障のための字幕付与を進めているが、京大教授らが開発したこのシステムは、放送大の講義で概ね９割の認識率を実現。マンパワーで書き起こしを作製するよりも効率的に字幕付与できることが確認された。

１００％の字幕付与目指す

今年度施行された障害者差別解消法では、障害者の社会的障壁の除去について〝必要かつ合理的な配慮〟を行うことが義務付けられており、聴覚障害者に対しては手話や字幕付与などの情報保障を行うことが、『配慮』に該当する。一方、ここ数年、さまざまな講義コンテンツやインターネット配信が行われているが、字幕が付与されているものはほとんどないのが現状。

放送大学は、わが国で最大のメディアを利用した高等教育機関で、約３００科目の講義がテレビやラジオで配信されている。その大半がインターネットでも配信され、スマートフォンやタブレットなどでも視聴可能。現在、字幕が付与されているのはテレビ講義番組の半数程度だが、近い将来１００％の字幕付与を目指している。

今年度から、すべての学習をインターネット上の講義や課題解答で行う「オンライン授業」も開設されており、原則的に字幕で付与する方針。この取組は、障害者支援で先進的な米国でも、オンライン学習の字幕は充実しているとはいえない現在、極めて画期的なものといえるが、人的・金銭的なコストが課題となっている。

専門用語が課題に

京都大大学院情報学研究科の河原達也教授と同大経済学研究科の秋田祐哉講師らは、自然な話し言葉を対象とした音声認識の研究を進めており、講演・講義に字幕付与を行うシステムを開発した。河原教授らの音声認識技術は、平成２３年度から衆議院の会議録システムに導入されており、さらに聴覚障害者のための字幕付与技術に関しても公開シンポジウムを毎年開催。障害者や速記者・要約筆記者などと意見交換やシステムの実証実験を行ってきた。

講演や講義への字幕付与の形態には、その場でリアルタイムに行う場合と、収録した映像に事後的に行う場合がある。前者はリアルタイム性が重視されるのに対して、後者では高い正確性が必要となり、特に大学の講義では、通常の音声認識システムでカバーされていない専門用語が多いことも課題だった。

河原教授らは放送大学の広瀬洋子教授らと連携し、放送大学の講義を対象とした音声認識・字幕付与に関して研究開発を推進。大規模な講演・講義のデータベースを用いて最新の深層学習を導入し、さらに教科書テキストから専門用語などの表現を自動的に登録することで、おおむね90％の認識率を実現した。

三分の一以上の時間短縮効果

約３０の講義を対象に音声認識結果を編集する場合と人手ですべて書き起こす場合とを比較した結果、システムを用いることで作業時間が短くなることも確認された。具体的には、システムの認識率が８７％以上を超えると優位性がみられ、９３％になると三分の一以上の時間短縮効果が確認できた。

放送大学では、今年度開始されたオンライン授業の字幕作成に活用。また、インターネット配信によるラジオ講義に字幕と静止画を付与したコンテンツも実験的に配信されている。今後、他の教育機関で作成されるさまざまな講義コンテンツに対する字幕付与への展開が期待される。

中央省庁及び都道府県の機関や関連団体などの事務従事者を対象に、執務上の参考に供するための各種情報を正確・確実・迅速にお届けしています。

2016年12月14日 講演・講義の音声から字幕を自動付与 京大教授らが開発、放送大のオンライン授業で活用

2016年12月14日講演・講義の音声から字幕を自動付与　京大教授らが開発、放送大のオンライン授業で活用