数学ソフトウェアデータベース swMATHの紹介

数学とコンピュータⅡ Advent Calendar 2017 - Qiita
この記事は数学とコンピュータアドベントカレンダーⅡ,14日目の記事です.数学ソフトウェアデータベース,swMATHを紹介します.

f:id:soma_arc:20171211191610p:plain
swMATHは数学ソフトウェア(Mathematical Software)のための情報サービスで,様々な数学ソフトウェアの情報をデータベースとして持っています.これらのソフトウェアの情報は数学の論文の引用情報を元に構築されており,ユーザーは自由にデータベースを検索することができます.

ここでの数学ソフトウェアとは,何らかの数学的な問題を解析したり,解いたり,シミュレーションしたりするソフトや,数学の定理やアルゴリズムに基いたソフトウェア,もしくはライブラリのことを指します.例えば,汎用的で大きなソフトウェアだと,MathematicaMatlab等があります.特定の数学分野に由来するものであると,GeoGebra Geometryや,Desmos,SnapPy等が挙げられるでしょうか.また,様々な計算を行うためのライブラリ(例えばPythonのSciPy, NumPy)も数学ソフトウェアとします.

機能

簡単に機能を紹介します.

適当に検索キーワードを入力して検索します.今回はgeometryで検索してみました.
f:id:soma_arc:20171211192215p:plain
すると,被引用文献数でソートされた検索結果がでてきます.SageMathをクリックしてみます.
f:id:soma_arc:20171211195711p:plain

ソフトウェアの概要とキーワードや関連ソフトが表示されます.ここからさらに検索をすすめる事が可能です.ページ中段に表示されている,ORMSとは別の数学ソフトウェアの情報サービスで,人手で信頼性の高いソフトウェア情報をまとめているサービスです.

ページ下部にはこのソフトウェアを論文中で引用している論文と,そのソフトウェアそのものに関する論文(standard articles)のリストが表示されます.
f:id:soma_arc:20171211195719p:plain
リストのリンクからzbMATHという数学論文データベースに飛ぶことで,その論文の詳細情報にアクセスすることができます.また,画面右側のチェックボックスを用いることで,リストのフィルタを操作することができます.出版時期やMSC(数学の分野の分類タグ)を用いて細かくフィルタできます.

また,各論文出版時のソフトウェアのウェブサイトを見ることもできます.画面右上のVersions: Infoをクリックすると,論文タイトルの横に当時のサイトのWeb Archiveへのリンクが表示されます.
f:id:soma_arc:20171213215825p:plain
f:id:soma_arc:20171213215808p:plain

以上がswMATHの機能の簡単な紹介です.

コンセプト

近年,数学ソフトウェアが数学の研究や教育の分野で非常に重要になっています.しかし,数学の学術論文の引用欄に数学ソフトが並ぶことがありながら,それらの数学ソフトウェアを広くアーカイブするような活動はなかなか行われて来ませんでした.数少ないアーカイブ活動は,特定の数学領域に閉じていたり,メンテナンスされずに古い情報しか残っていないという状態であったようです.

一方で,数学の学術論文アーカイブ活動は昔から行なわれてきています.電子的な情報サービスで有名なものにはzbMATHMathSciNetというプロジェクトが存在しています.こうしたサービスはたくさんの論文情報をアーカイブしています.これらはオープンアクセスではありませんが,レビュワーによる要約,評論もつけられています.

学術論文のアーカイブに対してソフトウェアのアーカイブは難しい問題です.例えば,数学の結果は一度論文として出版されれば,それは永久に残りつづけます.(もちろん間違いが含まれることはありますが)しかし,ソフトウェアの開発に終わりが来ることはありません.出版当時に使用されていたソフトウェアも絶えず改良され,変化していきます.逆にメンテナンスされることがなくなってしまえば,将来的には動かなくなってしまいます.

数学の結果はある程度,その主張が正しいか,正しくないかで評価することができます.しかし,ソフトウェアには数学に比べて,たくさんの評価軸が存在します.また,個人の書き捨てのスクリプトから,大きなソフトウェアプロジェクトまで,大小さまざまな数学ソフトウェアがどんどん増えています.

そのような理由から,ある程度の品質をもった数学ソフトウェアのデータベースを人手で継続的に作っていくのは現実的ではありません.そこでswMATHではPublication-based approachと呼ぶ手法を用いてある程度自動的にデータベースを構築しています.

Publication-based Approach

数学ソフトと数学の出版物は密に繋っています.はじめに出版物に記された数学のアイデアがあり,それがソフトウェアに実装されます.実装されたソフトウェアが新たな数学の結果を生み出します.それらの結果は論文として出版されるわけですが,その論文には使用したソフトウェアが引用されます.swMATHではこの引用情報を利用して,自動的にソフトウェアのデータベースを構築しています.学術論文として出版されている論文に引用されているということで,そのソフトウェアの品質はある程度保証することができます.また,被引用件数がそのままソフトウェアの信頼性の高さを表わす事にもなります.

swMATHでは,zbMATHを中心として数学論文データベースに登録されている論文の題名や,引用欄などから自動的にソフトウェア名,そのソフトの分類を検出し,データベースを構築しています.ソフトウェアの重要な情報元となるウェブページは,WebArchiveへのリンクを用いることで保存しています.なるべく人手をかけずにデータを収集し,メンテナンスコストがかかるような機能の実装は避けて,今日まで運用されています.

おわりに

数学ソフトウェアの情報サービス,swMATHを紹介しました.swMathは2011年あたりからプロジェクトがスタートしたようなのですが,利用者数,登録されているソフトウェア,論文数は増え続けているようです.ちなみに,データベースに登録されていないソフトウェアは登録を申請することもできます.
f:id:soma_arc:20171211193330p:plain
グラフはswMATH-2chartsより

数学に関連した情報サービスとして,とても面白いサービスだと思います.一度チェックしてみてはいかがでしょうか.

参考文献

  • Sebastian B¨onisch, Michael Brickenstein, Hagen Chrapary, Gert-Martin Greuel, and Wolfram Sperber.swMATH – A New Information Service for Mathematical Software
  • Gert-Martin Greuel and Wolfram Sperber. swMATH - An Information Service for Mathematical Software. In ICMS2014 Conference Proceedings
  • Hagen Chrapary and Yue Ren. The Software Portal swMATH: A State of the Art Report and Next Steps. In ICMS2016 Conference Proceedings
  • Helge Holzmann, Mila Runnwerth, Wolfram Sperber. Linking Mathematical Software in Web Archive. In ICMS2016 Conference Proceedings (arXiv)