そらもよう
「青空工作員マニュアル」改訂
青空文庫工作員マニュアルを、改訂した。
履歴に示したとおり、修正点は多岐に渡っているが、大半は、あやふやだった要素を明確化したり、運用の実態を成文化したりしたものだ。
白が黒に変わったような要素はない。
頭に置いて欲しいのは、以下の三点だ。
・外字注記
喉を掻き※[#「※」は「てへん+劣」、読みは「むし」、30-16]って
のように書いてきたが、下線部を省き、
喉を掻き※[#「てへん+劣」、読みは「むし」、30-16]って
と書くことにした。(→「3.入力-2」【外字の処理】)
・アルファベットの前後のアキ
アルファベットと、かな、漢字などが接するところには、半角のアキを入れ、
僕は Victor Hugo の Notre Dame を読んだとき、
のように入力することに決めた。(→「2.入力-1」【アルファベット】 )
・改行行頭の括弧の前のアキ
一部の底本では、改行行頭の「「」の前が、開けてある。
こうした際も、アキなしで入力することにした。(→「2.入力-1」【行頭の括弧の字下げ】)
ポイントは以上だが、全体に目を通してもらえれば、より確かに、迷いなく作業できる。
入力時、校正時には、プリントアウトを座右においていただけるとありがたい。
なお、これまでHTML版とともにおいてきたPDF版は、削除した。
DTPソフトで作った元ファイルが失われ、PDF版には、これまでの改訂内容も盛り込めないできた。プリントアウトには、この形式がなじみがよいのだが、一から作り直す時間がとれなかった。
今回の改訂作業には、青空文庫メーリングリストで取り組んだ。
進行係りの不手際が響いて、長期間に及ぶ、込み入った論議を強いられた。
忍耐をもって提案を続けてくれた仲間、経過を見守ってくれたメンバーに、心からのお礼を申し上げます。
先送りにした体裁情報の記述に関して、もう一度、力をふるってくださいますように。
青空文庫メーリングリストは、生きている。
新しい友よ、協働の場に来たれ!(倫)
履歴に示したとおり、修正点は多岐に渡っているが、大半は、あやふやだった要素を明確化したり、運用の実態を成文化したりしたものだ。
白が黒に変わったような要素はない。
頭に置いて欲しいのは、以下の三点だ。
・外字注記
喉を掻き※[#「※」は「てへん+劣」、読みは「むし」、30-16]って
のように書いてきたが、下線部を省き、
喉を掻き※[#「てへん+劣」、読みは「むし」、30-16]って
と書くことにした。(→「3.入力-2」【外字の処理】)
・アルファベットの前後のアキ
アルファベットと、かな、漢字などが接するところには、半角のアキを入れ、
僕は Victor Hugo の Notre Dame を読んだとき、
のように入力することに決めた。(→「2.入力-1」【アルファベット】 )
・改行行頭の括弧の前のアキ
一部の底本では、改行行頭の「「」の前が、開けてある。
こうした際も、アキなしで入力することにした。(→「2.入力-1」【行頭の括弧の字下げ】)
ポイントは以上だが、全体に目を通してもらえれば、より確かに、迷いなく作業できる。
入力時、校正時には、プリントアウトを座右においていただけるとありがたい。
なお、これまでHTML版とともにおいてきたPDF版は、削除した。
DTPソフトで作った元ファイルが失われ、PDF版には、これまでの改訂内容も盛り込めないできた。プリントアウトには、この形式がなじみがよいのだが、一から作り直す時間がとれなかった。
今回の改訂作業には、青空文庫メーリングリストで取り組んだ。
進行係りの不手際が響いて、長期間に及ぶ、込み入った論議を強いられた。
忍耐をもって提案を続けてくれた仲間、経過を見守ってくれたメンバーに、心からのお礼を申し上げます。
先送りにした体裁情報の記述に関して、もう一度、力をふるってくださいますように。
青空文庫メーリングリストは、生きている。
新しい友よ、協働の場に来たれ!(倫)
「TEXTの読み方」
柴田卓治さんが入力された夢野久作『創作人物の名前について』『謡曲黒白談』を登録する。校正は小林徹さんです。
今まで「電子テキストの読み方」というページがあったのですが、すっかり更新せずにほったらかしでした。それを「TEXTの読み方」という名前に変更してリニューアルしました。内容の方向性も少し変えて、主にPDA、携帯電話での青空文庫のテキストの読み方になっています。「青空文庫」なわけですから、やはり青空の下で読もう、ということを目指しています。まだ一部分しか完成していませんが、順次更新して行こうと思っています。(AG)
今まで「電子テキストの読み方」というページがあったのですが、すっかり更新せずにほったらかしでした。それを「TEXTの読み方」という名前に変更してリニューアルしました。内容の方向性も少し変えて、主にPDA、携帯電話での青空文庫のテキストの読み方になっています。「青空文庫」なわけですから、やはり青空の下で読もう、ということを目指しています。まだ一部分しか完成していませんが、順次更新して行こうと思っています。(AG)
新しいミラーサイト
青空文庫に、新しい支え手が現れた。
インターネットでテレビ番組表を提供しているOnTV Japanが、ミラーサイトを引き受けてくださった。
ありがとうございます。
青空文庫を、どうぞよろしく。
新ミラーサイトは、http://mirror.aozora.gr.jpですでに動きだしている。
強力なサーバーで、更新の遅れもない。ご贔屓に。
OnTV Japanの電子番組表からは、番組や出演者に関する情報が引き出せる。
いろいろな切り口での検索に対応していて、機器がそろっていれば、録画予約もここで簡単にできる。
同社の電子番組案内も、ご愛顧のほどを。
およそ2年半にわたってサーバーを提供してくださった、群馬インターネットのミラーサイトは、先ほど運用を停止した。
長い間、ありがとうございました。
同社の基盤は群馬だが、東京にもアクセスポイントがある。国内はもちろん、海外ローミングのサービスも、早くから提供してこられた。
プロバイダー選定の際には、群馬インターネットのメニューに是非、目を通してくださいますように。
今回の新規ミラーサイト開設にあたっても、松本吉彦さんのご尽力を得た。
毎度毎度で芸がないが、松本さんが何をしてこられたかは、『パソコン創世記』の第二部第五章でどうぞ。(倫)
インターネットでテレビ番組表を提供しているOnTV Japanが、ミラーサイトを引き受けてくださった。
ありがとうございます。
青空文庫を、どうぞよろしく。
新ミラーサイトは、http://mirror.aozora.gr.jpですでに動きだしている。
強力なサーバーで、更新の遅れもない。ご贔屓に。
OnTV Japanの電子番組表からは、番組や出演者に関する情報が引き出せる。
いろいろな切り口での検索に対応していて、機器がそろっていれば、録画予約もここで簡単にできる。
同社の電子番組案内も、ご愛顧のほどを。
およそ2年半にわたってサーバーを提供してくださった、群馬インターネットのミラーサイトは、先ほど運用を停止した。
長い間、ありがとうございました。
同社の基盤は群馬だが、東京にもアクセスポイントがある。国内はもちろん、海外ローミングのサービスも、早くから提供してこられた。
プロバイダー選定の際には、群馬インターネットのメニューに是非、目を通してくださいますように。
今回の新規ミラーサイト開設にあたっても、松本吉彦さんのご尽力を得た。
毎度毎度で芸がないが、松本さんが何をしてこられたかは、『パソコン創世記』の第二部第五章でどうぞ。(倫)
ミラーサイト停止のお知らせ
群馬インターネットのご支援によるミラーサイト、http://www9.wind.ne.jp/aozora/の運用を、今月の15日いっぱいで停止することになった。
2年半にわたって私たちを支えてくださった群馬インターネットのみなさんに、あらためてお礼を申し上げます。
本当に、ありがとうございました。
今年8月のデータでは、メイン、ミラーあわせて、1日およそ7000人強が青空文庫を利用する勘定になっていた。転送量は、1日およそ3Gバイト。月で90Gバイト強に達している。
アクセス、転送量の増加傾向は、今後も続くだろう。雑誌の付録CD-ROMといった〈バイパス〉をもっと利用してもらえるよう、工夫していきたいし、根本的にはミラーサイトを増やし、分散化を押し進めることで、負荷の増大に対処していきたいと考えている。
青空文庫増殖計画の第一歩として、新たにミラーを引き受けてくださるところも決まった。
15日までには準備をおえて、青空文庫の新しい支え手と、新ミラーサイトのURLをお知らせできると思う。(倫)
2年半にわたって私たちを支えてくださった群馬インターネットのみなさんに、あらためてお礼を申し上げます。
本当に、ありがとうございました。
今年8月のデータでは、メイン、ミラーあわせて、1日およそ7000人強が青空文庫を利用する勘定になっていた。転送量は、1日およそ3Gバイト。月で90Gバイト強に達している。
アクセス、転送量の増加傾向は、今後も続くだろう。雑誌の付録CD-ROMといった〈バイパス〉をもっと利用してもらえるよう、工夫していきたいし、根本的にはミラーサイトを増やし、分散化を押し進めることで、負荷の増大に対処していきたいと考えている。
青空文庫増殖計画の第一歩として、新たにミラーを引き受けてくださるところも決まった。
15日までには準備をおえて、青空文庫の新しい支え手と、新ミラーサイトのURLをお知らせできると思う。(倫)
「新JIS漢字総合索引」改訂
第1~第4水準までの漢字をたやすく見つけられる「新JIS漢字総合索引」を改訂した。この索引の使い方は、「新JIS漢字時代の扉を開こう!」で説明している。今回の改訂内容を反映するために、こちらもあらためた。
「索引」は、青空文庫のいしずえの一つになったと思う。
これをまとめられたことで、第3第4水準の漢字を使って外字の多くと縁を切る作業に、関わる人全員で取り組む準備が整った。内輪の話になるが、「現時点で何を外字に回すべきか」見きわめる、はっきりとした目安が得られた効果も大きかった。
新JISを使った文書作りは、今までの所、青空文庫が「明日の本棚」で進めているものくらいしかしらない。けれど、新JISへの移行が本格化した段階では、幅広い人が「索引」を使ってくれるだろうと期待している。
何しろ、自分たちが新JISに踏み込もうとしたとき、どうしても作らざるを得なかったツールだ。
きっと、みんなの役に立つ。
ただし、「索引」を文庫の仲間と使いはじめると、新しい問題がその「索引」そのものから生じるようになった。
例えば、コンピューターの文字の問題点として、しばしば指摘される森鴎外の「鴎」。印刷されたもので広く使われている「區+鳥」は、第1第2水準を決めた規格のルールでは、「鴎」のコードで入れてかまわないことになっている。
青空文庫の作業は、今もこのルールに従って進めているので、入力の元となる本に「區+鳥」があった場合も、「鴎」のコードで入れるのが、正しい作業方針だ。
ところが新JISでは、「區+鳥」が独自のコードを与えられた。「索引」には、第3水準に加えられた「區+鳥」を盛り込んである。底本とぴったり同じ「區+鳥」が見つかると、そこで「これだ!」と目が止まる。
「鴎」のコードで入れる代わり、当然「區+鳥」を使うべきだと気持ちが動く。
次に、この字が、文庫本体では今のところ使わないことにしている、第3水準の漢字であることを確認するステップがくる。
一般には、「第3第4水準の文字は外字注記する」のだという、マニュアルにある作業方針が頭に浮かび、結果的に「鴎」のコードで入れるべきものを、外字注記してしまう。
この新しい誤りのパターンが、「索引」の公開移行、ぽつぽつと現れるようになった。
こうした迷いを生じさせる文字が、「索引」には都合133字載っている。(適用されなくなる78互換包摂の29字と、包摂規準の適用が除外される104字)
これらを赤字で示し、現在の青空文庫の入力では、この文字を表すものとして使って良いコードの例示字体を、灰色で添えた。
文字コードの話は、「正しく書こう」とすると、途端にややこしくなる。
ざっくりと、多少の「嘘」も混じることを承知で言い直せば、底本に赤い字があった場合も灰色の字で入力するのが、現時点での正しい処置だ。
そのことを、一目でわかるように示すことが、今回の改訂の狙いである。
これまで「索引」を使ってこられた方には、改訂版への切り替えをお願いしたい。
あなたの作業の精度を、きっと高めてくれると思う。
何らかの形で、いわゆる電子出版に携わっておられる方、興味を持っておられる方にも、この機会に「索引」を試してみることをお薦めしたい。
第1~第4水準の漢字探しには、今のところこれが、もっとも便利な道具だと思う。
詳しい使い方は、あわせて更新した「新JIS漢字時代の扉を開こう!」所収の【「新JIS漢字総合索引」を使ってみよう】で説明している。
こちらにも、目を通していただけるとありがたい。
今回、「索引」の改訂内容を反映させるために、「新JIS漢字時代の扉を開こう!」を読み直してみて、堂々と「嘘」の領域に踏み込んでいる「分かりやすい表現」が多いのに、冷や汗をかいた。
積極的な更新内容は、新版「索引」への対応のみだが、頭から最後まで見直して、いろいろなところで字句をあらためた。
文字コードの話は、本当にむつかしい。
あらたまっていない間違いや、新たな誤りもあるかもしれない。
正すべき点があれば、info@aozora.gr.jp宛、よろしく御指摘ください。(倫)
「索引」は、青空文庫のいしずえの一つになったと思う。
これをまとめられたことで、第3第4水準の漢字を使って外字の多くと縁を切る作業に、関わる人全員で取り組む準備が整った。内輪の話になるが、「現時点で何を外字に回すべきか」見きわめる、はっきりとした目安が得られた効果も大きかった。
新JISを使った文書作りは、今までの所、青空文庫が「明日の本棚」で進めているものくらいしかしらない。けれど、新JISへの移行が本格化した段階では、幅広い人が「索引」を使ってくれるだろうと期待している。
何しろ、自分たちが新JISに踏み込もうとしたとき、どうしても作らざるを得なかったツールだ。
きっと、みんなの役に立つ。
ただし、「索引」を文庫の仲間と使いはじめると、新しい問題がその「索引」そのものから生じるようになった。
例えば、コンピューターの文字の問題点として、しばしば指摘される森鴎外の「鴎」。印刷されたもので広く使われている「區+鳥」は、第1第2水準を決めた規格のルールでは、「鴎」のコードで入れてかまわないことになっている。
青空文庫の作業は、今もこのルールに従って進めているので、入力の元となる本に「區+鳥」があった場合も、「鴎」のコードで入れるのが、正しい作業方針だ。
ところが新JISでは、「區+鳥」が独自のコードを与えられた。「索引」には、第3水準に加えられた「區+鳥」を盛り込んである。底本とぴったり同じ「區+鳥」が見つかると、そこで「これだ!」と目が止まる。
「鴎」のコードで入れる代わり、当然「區+鳥」を使うべきだと気持ちが動く。
次に、この字が、文庫本体では今のところ使わないことにしている、第3水準の漢字であることを確認するステップがくる。
一般には、「第3第4水準の文字は外字注記する」のだという、マニュアルにある作業方針が頭に浮かび、結果的に「鴎」のコードで入れるべきものを、外字注記してしまう。
この新しい誤りのパターンが、「索引」の公開移行、ぽつぽつと現れるようになった。
こうした迷いを生じさせる文字が、「索引」には都合133字載っている。(適用されなくなる78互換包摂の29字と、包摂規準の適用が除外される104字)
これらを赤字で示し、現在の青空文庫の入力では、この文字を表すものとして使って良いコードの例示字体を、灰色で添えた。
文字コードの話は、「正しく書こう」とすると、途端にややこしくなる。
ざっくりと、多少の「嘘」も混じることを承知で言い直せば、底本に赤い字があった場合も灰色の字で入力するのが、現時点での正しい処置だ。
そのことを、一目でわかるように示すことが、今回の改訂の狙いである。
これまで「索引」を使ってこられた方には、改訂版への切り替えをお願いしたい。
あなたの作業の精度を、きっと高めてくれると思う。
何らかの形で、いわゆる電子出版に携わっておられる方、興味を持っておられる方にも、この機会に「索引」を試してみることをお薦めしたい。
第1~第4水準の漢字探しには、今のところこれが、もっとも便利な道具だと思う。
詳しい使い方は、あわせて更新した「新JIS漢字時代の扉を開こう!」所収の【「新JIS漢字総合索引」を使ってみよう】で説明している。
こちらにも、目を通していただけるとありがたい。
今回、「索引」の改訂内容を反映させるために、「新JIS漢字時代の扉を開こう!」を読み直してみて、堂々と「嘘」の領域に踏み込んでいる「分かりやすい表現」が多いのに、冷や汗をかいた。
積極的な更新内容は、新版「索引」への対応のみだが、頭から最後まで見直して、いろいろなところで字句をあらためた。
文字コードの話は、本当にむつかしい。
あらたまっていない間違いや、新たな誤りもあるかもしれない。
正すべき点があれば、info@aozora.gr.jp宛、よろしく御指摘ください。(倫)
アクセント分解
包摂や当用漢字に関する資料など、ここしばらく、地味なお知らせが続いた。
作品公開という表看板の裏で、青空文庫は、コンピューターで日本語を扱う際の、足場がために関するあれこれにも手を染めている。
基礎的な作業はしばしば、きめ細かな論議や、息の長い積み重ねを求める。
こうしたやっかいな課題に、力を合わせて取り組んでいく広場となっているのが、青空文庫メーリングリストだ。
今日は、そこで積み重ねられてきた、アクセント付きラテン・アルファベットの表記に関する工夫について紹介したい。
青空文庫のファイルは、今時の日本語が使えるパソコンなら、すべてが対応している文字コード(第1第2水準の漢字を定めた、JIS X 0208)の範囲内で作っている。
こうしておけば、文字化けはおこらない。
ただし、ここにない字(外字)については、言葉を連ねて形を説明する羽目になる。
第1第2水準にない漢字は、「目+爭」といった形で、注記してきた。
フランス語のアクサンやドイツ語のウムラウトといったアクセントの付いたアルファベットは、「desir[#desirのeにアクサン・テギュ(´)]」などと書いてきた。
だが、なんとも武骨ですっきりしない。
もう少し枠を広げた文字コードに、外字の多くが組み込まれ、それが、情報機器に必ず組み入れられるようになれば、状況はかなり改善される。
第3第4水準の漢字を定めたJIS X 0213の文字集合は、アクセント付きアルファベットも広くカバーしている。
これが、新しい基盤として機能してくれるのではないかと、期待している。
ただし、次の土台がしっかり根付くまでには、まだ少し時間がかかる。
その間、アクセント付きには、相変わらず武骨な注記で対処するしかないのかという問題が残る。
青空文庫メーリングリストに、アクセント付きアルファベットの注記に関する質問が寄せられた際、山本有二さんから、各国のラテン文字を通常の日本語テキストの枠内で表記する工夫の提案があった。
例えば、アクサン・テギュ付きの「e」は「e'」と書く。
これなら、「desir[#desirのeにアクサン・テギュ(´)]」が「de'sir」ですむ。
かねてからこの問題を突き詰めてこられた山本さんは、どの言語のどの文字を、どう書き換えるかルールを定め、独自の「アクセント分解」方式を「アクセント付き文字の変換表」にまとめ上げておられた。
青空文庫の収録作品には、時々、アクセントが現れる。
中でも強烈なのが、九鬼周造の『「いき」の構造』だ。
この作品を入力して下さった鈴木厚司さんと山本さんが中心となって、「アクセント分解」を採用するにあたっての、細部の詰めが行われた。
鈴木さんは、『「いき」の構造』にこれを適用し、従来の青空文庫方式等と比較検討するために、「アクセント分解の表記例」をまとめ、全体をこの方式で貫いたファイルも用意してくださった。
従来形式とアクセント分解によるものを共に、この作品の図書カードからダウンロードできる。
興味のある方は、是非読み比べて、すっきり加減の程を堪能してほしい。
地味だけれど、大切な成果。
これをもとに、アクセント付きアルファベットの表記問題に青空文庫全体としてどう取り組むのか、じっくり考えていきたい。(倫)
作品公開という表看板の裏で、青空文庫は、コンピューターで日本語を扱う際の、足場がために関するあれこれにも手を染めている。
基礎的な作業はしばしば、きめ細かな論議や、息の長い積み重ねを求める。
こうしたやっかいな課題に、力を合わせて取り組んでいく広場となっているのが、青空文庫メーリングリストだ。
今日は、そこで積み重ねられてきた、アクセント付きラテン・アルファベットの表記に関する工夫について紹介したい。
青空文庫のファイルは、今時の日本語が使えるパソコンなら、すべてが対応している文字コード(第1第2水準の漢字を定めた、JIS X 0208)の範囲内で作っている。
こうしておけば、文字化けはおこらない。
ただし、ここにない字(外字)については、言葉を連ねて形を説明する羽目になる。
第1第2水準にない漢字は、「目+爭」といった形で、注記してきた。
フランス語のアクサンやドイツ語のウムラウトといったアクセントの付いたアルファベットは、「desir[#desirのeにアクサン・テギュ(´)]」などと書いてきた。
だが、なんとも武骨ですっきりしない。
もう少し枠を広げた文字コードに、外字の多くが組み込まれ、それが、情報機器に必ず組み入れられるようになれば、状況はかなり改善される。
第3第4水準の漢字を定めたJIS X 0213の文字集合は、アクセント付きアルファベットも広くカバーしている。
これが、新しい基盤として機能してくれるのではないかと、期待している。
ただし、次の土台がしっかり根付くまでには、まだ少し時間がかかる。
その間、アクセント付きには、相変わらず武骨な注記で対処するしかないのかという問題が残る。
青空文庫メーリングリストに、アクセント付きアルファベットの注記に関する質問が寄せられた際、山本有二さんから、各国のラテン文字を通常の日本語テキストの枠内で表記する工夫の提案があった。
例えば、アクサン・テギュ付きの「e」は「e'」と書く。
これなら、「desir[#desirのeにアクサン・テギュ(´)]」が「de'sir」ですむ。
かねてからこの問題を突き詰めてこられた山本さんは、どの言語のどの文字を、どう書き換えるかルールを定め、独自の「アクセント分解」方式を「アクセント付き文字の変換表」にまとめ上げておられた。
青空文庫の収録作品には、時々、アクセントが現れる。
中でも強烈なのが、九鬼周造の『「いき」の構造』だ。
この作品を入力して下さった鈴木厚司さんと山本さんが中心となって、「アクセント分解」を採用するにあたっての、細部の詰めが行われた。
鈴木さんは、『「いき」の構造』にこれを適用し、従来の青空文庫方式等と比較検討するために、「アクセント分解の表記例」をまとめ、全体をこの方式で貫いたファイルも用意してくださった。
従来形式とアクセント分解によるものを共に、この作品の図書カードからダウンロードできる。
興味のある方は、是非読み比べて、すっきり加減の程を堪能してほしい。
地味だけれど、大切な成果。
これをもとに、アクセント付きアルファベットの表記問題に青空文庫全体としてどう取り組むのか、じっくり考えていきたい。(倫)
JIS X 0208と0213規格票の包摂関連項目
文字の形がわずかに違っている場合、同じ字として扱うのか、それとも別の字として区別するのか。
こうした際の判断の目安を、JIS漢字コードは、かなり細かいところまで踏み込んで定めている。
このルールに関する文書を入力して、「JIS X 0208と0213規格票の包摂関連項目」に置いた。
今回の作業の延長上に、上記ページに置いてある「包摂規準の詳細」の適用例を拡充して、最終的には「包摂規準索引」に相当するものを、「新JIS漢字総合索引」と同じ形式で用意したいと考えている。
もっぱら読む立場で、青空文庫を利用している方には、ピンとこない話だろう。
でも、パソコンによる読み書きを続ける中で、文字づかいが気になったり、文字の厳密な取り扱いを迫られたりすれば、最終的には誰もが、この文書を開かざるを得ないはずだ。
現在、文庫で力をふるってくれている人には、すぐにでも活用してもらえる。
入力の下敷きにする本を開いて作業を始めると、画面やプリントアウトの字と、印刷されたものの形が微妙に違っているケースに出合う。
「辻」のしんにょうの点が、一つと二つは区別するのか。草かんむりの間が切れたものと繋がったものとは、別字扱いになるのか。
このような疑問は、すべての作業者が抱いて当然で、図らずも世話役を引き受けることになった我々は、繰り返し繰り返し包摂に関する問いに答えてきた。
その際、私たちが判断のよりどころとしてきたのが、今回公開した、この文書だ。
ならば、誰もが参照できる形に、とっとと仕立てておけば。
「なぜそうしなかったのか?」と、当然の疑問がわくと思う。
JIS(日本工業規格)は、著作権法の保護の対象ではない。
生きた規格として活用されるためには、広く知られること、正しく理解されることこそが大切なのだから、参照の壁をできる限り低くしてやることこそが課題。これは当然の措置だろう。
規格の「普及並びに啓発等を図」ることを目的とした、大きな組織も存在し、規格票の発行にあたっている。
これまでの印刷物を用いた手段に加え、インターネットという仕組みが利用できるようになったのなら、こうした組織こそこれを活用し、「普及並びに啓発」を図ってくれれば、どんなにありがたいかと思う。
包摂規準を明確に定めた「JIS X 0208」の1997年改正から、およそ4年半。
今頃になって、まったくの私的なグループがこうしたファイルを作成し、公開するというのも、なんだか情けない事の成り行きだ。(倫)
こうした際の判断の目安を、JIS漢字コードは、かなり細かいところまで踏み込んで定めている。
このルールに関する文書を入力して、「JIS X 0208と0213規格票の包摂関連項目」に置いた。
今回の作業の延長上に、上記ページに置いてある「包摂規準の詳細」の適用例を拡充して、最終的には「包摂規準索引」に相当するものを、「新JIS漢字総合索引」と同じ形式で用意したいと考えている。
もっぱら読む立場で、青空文庫を利用している方には、ピンとこない話だろう。
でも、パソコンによる読み書きを続ける中で、文字づかいが気になったり、文字の厳密な取り扱いを迫られたりすれば、最終的には誰もが、この文書を開かざるを得ないはずだ。
現在、文庫で力をふるってくれている人には、すぐにでも活用してもらえる。
入力の下敷きにする本を開いて作業を始めると、画面やプリントアウトの字と、印刷されたものの形が微妙に違っているケースに出合う。
「辻」のしんにょうの点が、一つと二つは区別するのか。草かんむりの間が切れたものと繋がったものとは、別字扱いになるのか。
このような疑問は、すべての作業者が抱いて当然で、図らずも世話役を引き受けることになった我々は、繰り返し繰り返し包摂に関する問いに答えてきた。
その際、私たちが判断のよりどころとしてきたのが、今回公開した、この文書だ。
ならば、誰もが参照できる形に、とっとと仕立てておけば。
「なぜそうしなかったのか?」と、当然の疑問がわくと思う。
JIS(日本工業規格)は、著作権法の保護の対象ではない。
生きた規格として活用されるためには、広く知られること、正しく理解されることこそが大切なのだから、参照の壁をできる限り低くしてやることこそが課題。これは当然の措置だろう。
規格の「普及並びに啓発等を図」ることを目的とした、大きな組織も存在し、規格票の発行にあたっている。
これまでの印刷物を用いた手段に加え、インターネットという仕組みが利用できるようになったのなら、こうした組織こそこれを活用し、「普及並びに啓発」を図ってくれれば、どんなにありがたいかと思う。
包摂規準を明確に定めた「JIS X 0208」の1997年改正から、およそ4年半。
今頃になって、まったくの私的なグループがこうしたファイルを作成し、公開するというのも、なんだか情けない事の成り行きだ。(倫)
「新JIS漢字総合索引」面区点番号付きバージョン
「新JIS漢字総合索引」を公開してから、約半年。
当初は「音訓や画数をもとにして、目的の文字を探し、コピー&ペーストできれば便利」ということで作ったものだ。
しかし、使っているうちに、不便な面にも気が付く。その最大のものは、「目的の漢字が第1、第2水準なのか、第3、第4水準なのか、この索引だけではわからない」ということである。また、どうせなら文字コードも同時にわかれば、なお便利だろう。
そんな思いを反映して、面区点番号付きのバージョンを用意した。従来どおりのバージョンと共に、「青空文庫『明日の硯箱』」に置いてある。
また、この作業をすすめる過程で、従来のバージョンに細かいミスが2箇所あることに気づいた。実用上、大きな問題はないけれど、この機会にダウンロードしなおしていただけるとありがたい。
面区点番号付き「新JIS漢字総合索引」の作成にあたって、スクリプトの作成などの面で、多くの人にお世話になりました。この場を借りて、深くお礼を申し上げます。(LC)
当初は「音訓や画数をもとにして、目的の文字を探し、コピー&ペーストできれば便利」ということで作ったものだ。
しかし、使っているうちに、不便な面にも気が付く。その最大のものは、「目的の漢字が第1、第2水準なのか、第3、第4水準なのか、この索引だけではわからない」ということである。また、どうせなら文字コードも同時にわかれば、なお便利だろう。
そんな思いを反映して、面区点番号付きのバージョンを用意した。従来どおりのバージョンと共に、「青空文庫『明日の硯箱』」に置いてある。
また、この作業をすすめる過程で、従来のバージョンに細かいミスが2箇所あることに気づいた。実用上、大きな問題はないけれど、この機会にダウンロードしなおしていただけるとありがたい。
面区点番号付き「新JIS漢字総合索引」の作成にあたって、スクリプトの作成などの面で、多くの人にお世話になりました。この場を借りて、深くお礼を申し上げます。(LC)
「青空工作員マニュアル」修正
昨日付けで、「青空工作員マニュアル」を一部修正した。
書き換えたのは、「1.底本選び~作業の流れ」の、「■底本を選ぶ」の項。
・すでに登録済みの作品であっても、新字新仮名版、旧字旧仮名版といった表記形式が異なるものなら、新たに入力してもらってかまわない。
・抄録形式は避け、作品全体での登録を目指す。
・他のサイトで公開されていることを理由に、青空文庫での着手を拒まない。
以上、三点は、これまでの運用実態の明文化。
加えて、「法令には原則的に取り組まない」という新しい要素を、一つ加えている。
去る4月1日、総務省は「法令データ提供システム」の運用を開始した。現在施行されているすべての法令が網羅され、新しいものも、官報掲載後1、2か月のうちには提供されるという。データの利用に制限はなく、信頼性も、きわめて高いと思われる。法令は、基本的にこのシステムに委ねようと判断した次第だ。(倫)
書き換えたのは、「1.底本選び~作業の流れ」の、「■底本を選ぶ」の項。
・すでに登録済みの作品であっても、新字新仮名版、旧字旧仮名版といった表記形式が異なるものなら、新たに入力してもらってかまわない。
・抄録形式は避け、作品全体での登録を目指す。
・他のサイトで公開されていることを理由に、青空文庫での着手を拒まない。
以上、三点は、これまでの運用実態の明文化。
加えて、「法令には原則的に取り組まない」という新しい要素を、一つ加えている。
去る4月1日、総務省は「法令データ提供システム」の運用を開始した。現在施行されているすべての法令が網羅され、新しいものも、官報掲載後1、2か月のうちには提供されるという。データの利用に制限はなく、信頼性も、きわめて高いと思われる。法令は、基本的にこのシステムに委ねようと判断した次第だ。(倫)