2023年2月16日 ウェブで使える作物家系図の作成ツール 品種の祖先・子孫の情報に関するデータベース

農研機構と情報・システム研究機構は、作物の家系図を利用者が自由に作成できるデータベース「Pedigree Finder」を開発した。このデータベースは、作物種・世代数などの情報を入力することで、品種・系統の類縁関係とそれらが示す作物特性を関連づけて表示できる。このため、育種関係者が目的とする形質を持った品種育成に最適な両親の組合せを効率的に選ぶことに利用できる。さらに、複数の作物種において同一の方法で簡便に利用できることから、生産者や消費者が品種の特性を理解するツールとするなど、家系情報活用ツールとしての幅広い利用が期待される。

 

誰もが作物の家系情報を簡単に活用 できるデータベースの開発への期待

作物は、全世界的な食料需要量の増加、食料安全保障を取り巻く国内外の状況の変化や激しさを増す気候変動等に対応するため、常に新たな品種の育成が求められている。育種の加速化・効率化を進めるには、育種関連情報を整備し、かつ、複雑な家系情報の簡便で網羅的な検索・閲覧を可能とすることで、研究者や育種者の調査負担の軽減を図る必要があった。

また、品種等の育成過程を記録したものの多くが祖先方向に数世代しか系譜を遡ることができず、子孫方向の情報を得ることが難しいため、限定された範囲の家系情報で最適な交配組合わせを判断せざるを得ない状況だった。そのため、誰もが作物の家系情報を簡単に活用することができるデータベースの開発が望まれていた。

 

家系情報に係るデータ整備の現状

作物の家系情報は、品種育成過程の重要な育種操作である交配親の選定において、最適な組合わせを判断するために重要な情報だが、データの利活用には、①育種関連情報は研究機関や作物ごとに記録・管理されている ②紙媒体や電子媒体など、データの保管媒体が統一されていない ③家系情報が図示された家系図(絵)として保管されている場合も少なくないことから、新たに手作業で家系図を作成するには非常に労力を要し、データとして利活用しづらい問題がある ④育種関連情報として記録されている育種方法や交配親の表記に〝ゆらぎ〝があり、データとしての利活用を一層困難にしている(例:ある記録中では「選抜」による育種が、「純系分離」や「抜穂」と記載されているなど語彙が統一されていない)― といった問題があった。

このため、家系情報を整理・活用するためには、データ作成ルールとともに、育種の過程で用いられる語彙(オントロジー)などについても整備する必要があった。

 

データベースの機能

〈効率よく検索・閲覧できるウェブシステム〉

系統名を入力後、作物を選択することで、品種等の家系情報を表示できる。また、家系情報が更新された場合には、適切なレイアウトで家系図が自動作成される。ウェブシステムの活用により、最新情報へのアクセスや共有が容易になった。

〈作物の家系情報の可視化〉

グラフデータベースを活用し、作物の家系情報をネットワーク形式で分かりやすく可視化できる。

〈祖先・子孫の世代数を指定した表示〉

Evo Tree Plusなどのツールと比較して、子孫方向への探索機能も充実させている。交配に使われた回数が多い系統や子孫の数が多い系統の調査など、様々な角度から品種等の重要度を検討し、品種等の起源や近縁関係、ゲノム情報を考慮して戦略的に育種素材を選ぶことが可能になる。

〈形質・遺伝子型情報による色分け〉

家系図を形質・遺伝子型情報によって異なる色で塗り分けることにより、家系に特徴的な特性の検索、遺伝様式についての手がかりを視覚的にとらえることに役立つ。

〈作物の家系情報の分析基盤の整備〉

近縁係数計算プログラムの整備により、作物の交配を計画する際に、遺伝的な近縁性を考慮することが可能。

〈ユーザーごとのデータアクセス管理〉

データの公開・非公開についてはデータ提供機関の意見を踏まえて設定しており、アクセス権の制御により特定のユーザー間におけるデータ共有が可能となっている。

 

あらゆる作物に利用可能なデータ形式の整備

今回、育種関連情報を整備するためにオントロジー「Pedigree Finder Ontology(PFO)」が構築され、家系情報の標準フォーマットの決定、情報の電子化が行われた。

また、作物横断的にデータを活用するため、RDF(Resource Description Framework)でデータを整備し、育種関連情報をユーザー(研究者や育種者など)が効率よく検索できるようになった。RDFでデータを整備することで、データの意味を理解したプログラムの作成が容易になり、AI分野での更なる活用も期待される。

さらに、系統をIDで管理し、品種等名の表記の〝ゆらぎ〟に対応している。

作物の家系情報を取り扱うデータフォーマットはこれまでもいくつか開発・公開されているが、突然変異育種や純系分離などの交配育種以外で得られた品種等を抑えるものはなく、系統の識別性という観点からも本データベースには新規性がある。

 

各種データの統合利用が可能に

近年、形質データに加えて、ゲノム情報データや画像データなど、様々な育種に有用な情報が作物品種等に関連付けられて利用可能になっている。その一方で、家系情報にこれらのデータをひも付ける仕組みがなかったため、各種データを連携した有効利用ができなかった。今回の研究で開発した「Pedigree Finder」によって、家系情報をハブとして育種に必要な各種データの統合利用が可能になると期待される。

データベース開発の過程では、様々な作物の育種者の要望やデータ解析担当者のニーズが数多く反映されており、情報が最適に集約されているため、ユーザーが必要な情報を簡単に探し出すことができる。

 

今後は機能の追加を計画

研究グループでは今後、作物の家系情報を簡単に更新できる仕組みを構築するとともに、作物の種類も増やしていく予定としている。また、品種の特性やゲノム情報も合わせて利用できるように、機能の追加を計画している。

「Pedigree Finder」により育種データの蓄積・共有が促進され、多くのデータをお互いに参照することで品種育成が加速化することが期待される。一例として、たくさんの情報の中から、機能性成分の含有量の高さに注目する場合、その情報を品種の家系情報と合わせて表示させることで、含有量の高い品種や家系を視覚的に把握でき、交配親を効率的に選定することができる。

「Pedigree Finder」で整備されたデータは、育種だけでなく様々な食農情報に対してAIなどによる新たな技術開発の基盤となり、豊かな食や農を実現するために利用することができる。


株式会社官庁通信社
〒101-0041 東京都千代田区神田須田町2-13-14
--総務部--TEL 03-3251-5751 FAX 03-3251-5753
--編集部--TEL 03-3251-5755 FAX 03-3251-5754

Copyright 株式会社官庁通信社 All Rights Reserved.