学部プロジェクト
遠野方言音声の収録と
方言音声活用のための情報技術研究
伊藤 慶明,松原 雅文
近年、テレビやインターネットの普及に伴い、地方でも通常の会話で標準語が話されるようになり、方言を話す人および地域が縮退傾向にあります。一方、方言を守る、残す機運も高まっており、遠野「語り部」1000人プロジェクトのような行政が主体となって方言で話される民話を保存し語り継ぐ活動が行われています。
本研究課題の研究代表者(東京出身)と大学4年生の学生(兵庫出身)が、「とおの物語の館」で毎日開催されている語り部の民話を実際に聴取しましたが、方言が強くキーワードが良くは分からず、あらすじ自体も理解しづらかったというという経験がありました。語り部が民話を話している中で、話されたキーワードが自動表示できたり、先ほどのキーワードが何か、例えば「ざしきわらし」などのキーワードを言葉で検索し、その意味が表示できたりすれば視聴や方言の理解に役に立つと考えられます。
上記のような問題認識のもと本研究課題では、これまでの研究成果を踏まえて以下の課題に取り組む予定にしています。
(1)遠野方言民話の収録
現在、遠野の語り部は10年前に収録した数名の語り部の音声しか残っていない。そこで本研究課題では、現在の語り部の民話の収録を実験的に行う予定です。
(2)方言音声の検索機能の実現
近年深層学習の進展により、音声認識が高度化し実利用もされ始めていますが、方言については対応できていないのが現状です。数百万人が話す関西弁でさえその音声認識システムは構築されていません。方言に対しては、方言の辞書やその言葉の並びをテキスト上で記述されたデータがないため、音声認識システムを構築することは不可能に近く、日本国内、海外でも方言に対する研究が進んでいない状況にあります。一方、我々がこれまで研究を進めてきた、語彙に依らない音声検索システムは、音節や音素をベースとして検索を行うため、方言への適用が期待できます。音素体系も異なる方言音声に対して、本研究課題ではまず、方言音声に対する検索技術の可能性を検討します。
(3)検索技術に基づく民話の理解・方言の理解のためのサポート
一般の人が遠野方言の民話を聞いても前述の通り理解しきれないのが現状です。折角の語り部の話す、味のある、温かみのある遠野方言の語りを十分伝えきれていないのは、遠野地域においても危惧しているところです。本研究課題では、この語りが民話を話している最中に、キーワードが話された時に、そのキーワードの意味を表示するような、聞き手の理解をサポートするシステムの可能性を検討していきます。これにより、語り部の話を遮ることなくまたその温かみも維持しつつ、サポートしたいと考えています。