: Dadh Baronr アーヴ語で話そう、アーヴ語を書こう

アーヴ語で話そう

サイトを初めて一年半余が経ちましたが、あいかわらず相手がいません。

混みあへる電車の中で足を踏まれひとりオーニュとつぶやいてみる&sp;&sp;Sidrÿac

アーヴ語を書こう

アーヴ語を話す、のはさておき、アーヴ語を書くことはもう少し簡単である。単語を書くぐらいなら誰にでもできる。またもう少し勉強すれば、簡単な文を綴ることもできる。たとえばこんな感じ。

F'a Sidryale ruma Ciïoté Bascaingamr.

文法の問題をクリアするのは比較的簡単である。少なくとも、タカマガハラ語と系統的に近い古代ニッポン語の話者、つまり二十世紀的にいえば現代日本語の話者にとっては、アーヴ語はエスペラント語よりもずっと覚えやすい言語である。もっとも副詞についてはエスペラント語のほうがアーヴ語より規則性が高いのだが、それはささいな問題であろう。

次に問題になるのは表記の問題である。現在、アーヴ語を表記するには三つの方法が知られている。すなわち

  1. カタカナ転写表記
  2. ラテン文字転写表記
  3. アース表記

である。ちなみに本サイトでは、ラテン文字転写表記を暫定的に採用している。

本サイトで推奨する表記習慣は、以下の通りである。

  1. 手書きテキストでは可能なかぎりアース表記を用いる。
  2. 電子化テキストでは環境に応じて、以下の方法を使いわける。
    1. us-ascii および latin-1特殊文字(é,ï,ü,ÿ)を表示できないその他の非多言語化文字コード(iso-2022-jp、いわゆるJISコードを含む)では特殊記号を用いないか、" および ' を付して、ラテン文字に転写する。その際、特殊記号を付けたラテン文字の転写における国際的な表記慣習を守ることが望ましい。したがって特殊記号は文字の前に付け、後には付けない(例: m'enh = ménh)。またアーヴ語を普通の言語と同様に扱い、かっこを付すなどの特段の表記を行わない。なお言語学では、[ ] は発音表記、/ / は音素表記のために用いられる符合である。
    2. latin-1 または iso-2022-jp-2 などの多言語化(国際化)された文字コードにおいては、特殊文字(é,ï,ü,ÿ)を用いて、ラテン文字に転写する。ただし Unicode + UTF-8 は優雅でないのでこれを認めない。
    3. アースを表示できる文字コードを定義し、これを使用する。できれば多言語化されたものが好ましいが、フェンスが明確に定義されていれば us-ascii の l10n 等であっても当分のあいだ許容する。

電子化テキストにおいて、もっとも望ましい表示方法は最後の方法である。アースの電子化にはいくつかの構想が提出されてきた。

現在のところ実装可能な規格としてはTRON文字コードがある。 登録プロジェクト関係者各位のご尽力と森岡氏を初めとする権利者各位のご協力により、2001年10月31日、アースは「アーヴ文字(アース)」として TRON文字コードに正式に登録された。また、TRON文字へのアース登録プロジェクトは、普及プロジェクトへと発展的解消しており、現在は入力環境の整備・普及が行われている。

いまや TRON 使用に必要な環境(超漢字 + アースフォント)さえととのえば、アースを使った電子化文書を容易に作成することができる。また超漢字ユーザー同士であればアースを用いた超漢字にはメイルをやりとりすることも可能である。

なおフォントは、超漢字とともに配布されているもののほか、TrueType フォントからコンヴァートして使うことも可能である。詳しくは普及プロジェクトのペイジを参照されたい。

ここに筆者からあらためて関係者の皆様の尽力に百万の感謝を捧げる。

以前は横行していた xbm や gif image によるアース表記がすたれてきたことは、アーヴ語テキストをテキストとして扱える環境構築のためにまことによろこばしい。テキスト本体と、gif image のような本来テキストデータを扱うことを目的としないバイナリデータ自体を混交することは、テキスト表示方法として Unicode 以上に邪悪なものなので、本サイトではこれを認めない。画像ファイルの欠点としては、

などが挙げられる。アーヴ語研究および使用の目的に鑑みれば、これらの操作を許さない画像ファイルを、アーヴ語コーパス本体として使うことが論外であることが理解いただけるだろう。(100x4KB の gif ファイルだけで出来た e-mail が届いたら、どんな気がしますか?)

なお「アーヴ語TRON文字コード化」計画の他にも、METAFONT による TeX での表示の試みや、pdf によるアーヴ語表示の試みがなされている。DHTML による表示は 2001年 5月 20日現在では、いまだ確認されていない。

tex ファイルは ps および pdf による原稿出力言語であり、また移植性に富むという利点があるが、その一方、やはり構造化されたテキストであるため、html で書かれたアーヴ語ラテン文字表記テキストと同じくテキストファイルとして操作しづらいという欠点も持っている(告白すると、私は html 化された自分のテキストを grep するときに、一日に一回くらいは & をコメントアウトしわすれてマシンを呪詛することがある)。

pdf によるアーヴ語表記は2001年2月現在急速に普及しつつあるが、現在多く使用されている方式は、WYSIWIG を前提とし、us-ascii を用いながらその技術規格が想定しない構造化をほどこし、そのために大半の OS で想定されている文字コードと gryph の対応が得られないという欠点をもつ。またテキスト構造化自体の問題点(アーヴ語の文字に us-ascii の文字を恣意的に対応させる)から、ある種の誤記が生じやすいという副次的な欠陥も潜んでいる。

中尾・伊藤『人文系論文作法』夏目書房でも指摘されているように、構造化テキストは本来コーパスに向かないため、上記の方法によっては、処理容易なアーヴ語コーパスを得ることは難しい。したがって、アーヴ語を研究対象とすること自体には、上記の方法はほとんど寄与しないといってもよい。ただしこれらの方法は、バイナリファイルを用いざるをえない gif 表示などと比べれば無限大ましなので、いま緊急に自分の環境でアースを表示させたい方には、これらの方法を取られることをお勧めする。なお pdf を plain text に変換するツールも存在するので、pdf のアース表記ファイルから欧文文字転写方式のテキストファイルを直接得ることも不可能ではないと思われるが、筆者はこれを試したことがない。

このペイジの冒頭に戻る
アーヴ文字(アース)TRON文字コード普及プロジェクトについてもっと知る


Most recent update: 3/31/2002
First publification: 7/31/2000
Copyright and contact information is available.
URL: http://dadh-baronr.s5.xrea.com/etc/speakinbaronh.html