Information/Sensibility
新聞や雑誌など毎日何気なく私たちは文字を目にしながら言語に触れている。それらを言語情報として大量に集め、コンピュータ処理で様々に加工することによって、語の使われる頻度や使われる状況など、辞書には記述されていない内容が近年になって徐々に解明されてきている。これらのデータを分析し、外国語教育における言語材料や教材開発への応用可能性を探究する。
コンピュータ上のコーパスを用いた言語研究は歴史的にはまだ浅いものの、これまでに様々な分析手法やツールが開発されており、今後も新たに開発されていくことは間違いない。しかしながら、分析のための基本的な考え方はほぼ同じである。大量の言語資料から目的の表現を抽出し、その表現の共起関係や頻度及び使用域といった言語特性を観察し統計的に処理していくことにある。正規表現を用いたプログラミングはコーパス分析に大変役立ち、アイディア次第で既存有償ツールに縛られない、柔軟な分析が可能となる。
これまでの人間の感性や直観に基づく言語記述から、各種言語資料の集積によるデータ分析に基づく記述に変化しており、語法に関してエビデ ンスの提示といった言語の可視化が実現できるようになる。
コンピュータの性能向上により、言語資料の大規模化、処理速度の高速化が進んでおり、PerlやPython等のプログラミング言語による正規表現を駆使した分析手法が求められている。
教科書、付属問題集の他、辞書、文法書といった書籍編纂の相談など。
英語・日本語の各種コーパスが利用できます。