Logo

そらもよう

井上円了の世界旅行

 本日、井上円了「西航日録」を公開する。井上円了の世界旅行の記録である。井上円了は、世界旅行と呼べる旅を明治時代に3回も行っている。「西航日録」は二度目の旅の記録である。
 アジアからヨーロッパまでの多くの国を見た井上円了の感想は、「教育は重要である」という一言に尽きる。「西航日録」はこう締めくくられている。
ーーーーーー
余、いささかここに思うところありて、日本人の気象を一変し、日本国の気風を一新するは、ひとり学校教育の力の及ぶところにあらず、必ずや学校以外に国民教育の方法を講ぜざるを得ざるを知り、帰朝早々、修身教会設立の旨趣を発表するに至る。世間もし、余とその感を同じくするものあらば、請う、これを賛助せよ。
ーーーーーー
 井上円了は「日本人の気象を一変し」とまで書いているが、寺田寅彦の随筆などを読むと、昔も今も変わっていないなあ、と感じてしまう。こうなってしまう一因は、過去の文献が思うほどには現在に利用出来ないことがあると思う。過去の記録が明確に伝わるならば、同じ間違いは繰り返すことは少なくなるであろう。電子テキストならば、場所だけでなく、時代も飛び越えてゆける。青空文庫がその助けになれば、幸いである。
 しかし、現在の青空文庫に収録されているのは、やはり、明治、大正のものが多い。それでも、著作権保護期間が延長されない限り、明日1月1日には、新しい作家の作品が加わり、一年ごとに近代から現代へと収録される作品は移って行く。また、現在を未来に伝えるためにも、電子テキストは役に立つことだろう。今年の青空文庫は、電子テキストのフォーマットの準備へかなりの労力を割いてきた。その努力が実って、電子テキストが、未来へ現在を伝える助けになればよいと願っている。(門)

第11期(2009年9月1日~2010年8月31日)会計報告

2010年8月末に終了した青空文庫第11期の会計報告をいたします。
第11期は大きな支出となる行事や製作物はありませんでした。
「組版案内」のために新たなレンタルサーバを契約しました。この費用は年額2万円程度に抑えられています。
また「組版案内」において皆さんに利用していただいているソフトウェア(txt2xhtml)は青空文庫の資産として計上しています。
前期に引き続き寄付をいただきました。改めて感謝の気持ちを申し上げます。(青空文庫会計部)

「組版案内」で動かせるXHTML変換プログラムを最新版に更新

青空文庫では、テキスト版をXHTML版に自動変換している。
11月1日の公開分からは、このとき使うプログラムを、バグ修正版に切り替えていた。
案内はしなかったが、続いて、検討してきた「ルビタグに変換する注記の開始/終了型」に対応した機能を、修正版に盛り込んだ。

「組版案内」の「変換してみる」では、このプログラムを誰にでも使ってもらえる。
ここに置いたものも、現時点の最新版に差し替えた。

修正点は、11月1日の「注記とXHTML版変換プログラムの調整」で報告した通り。
これに、新設した「ルビタグに変換する注記の開始/終了型」の変換機能を加えてある。

ただし、差し替えたのは「変換してみる」で使えるものだけだ。
ダウンロード用の一式の差し替えは、文書の整備と、検討中のルビタグの扱いを決めてからにさせてもらう。(倫)

読書新聞「ちへいせん」一時休刊

これもiswebライトにあった、読書新聞「ちへいせん」が開けなくなっていた。
本日、空振りになるリンクを外し、公開一時停止とした。
編集長は、整理しての再開を検討してくださるという。(倫)

リチャード・バラム・ミドルトン作品のリンク切れ解消

次の二作品のリンク切れを解消した。(倫)

 リチャード・バラム・ミドルトン、hiro訳「月の子たち
 リチャード・バラム・ミドルトン、hiro訳「ブライトン街道にて

開けなくなったファイルの復活完了

11月に入って読めなくなっていたものの残り、6作品も、開けるようになった。

 豊田勇造「歌旅日記 ジャマイカ編
 豊田勇造「歌旅日記 日本編
 豊田勇造、高瀬泰司「対談・12年目の大文字が燃える京都で
 浜野サトル「新都市音楽ノート
 北陸の子供たち21名「北陸の子供たちの詩
 松平維秋「松平維秋の仕事

浜野さん、もう一度、ありがとう。(倫)

開けなくなったファイルとその復活

著作権ありの作品ファイルのいくつかが、インフォシークiswebライトに置かれていた。
10月31日にサービスが止まって、そこにあったものが開けなくなった。

 秋野平「ロック、70年代―復刻CDに時代を聴く」
 立花実「ジャズへの愛着」
 種田山頭火、三浦久、グリーンジェイムズ「英語対訳版草木塔抄他/Fire on the Mountain」
 豊田勇造「歌旅日記-ジャマイカ編」
 豊田勇造「歌旅日記-日本編」
 豊田勇造、高瀬泰司「対談・12年目の大文字が燃える京都で」
 浜野サトル「新都市音楽ノート」
 北陸の子供たち21名「北陸の子供たちの詩」
 松平維秋「松平維秋の仕事」

これらのファイルを整えてくださった浜野智さんの働きによって、本日から、「ロック、70年代―復刻CDに時代を聴く」と「ジャズへの愛着」、「英語対訳版草木塔抄他/FireontheMountain」が再度、開けるようになった。
提供ファイルはテキストとHTML。エキスパンドブックは廃止とする。
その他の作品にも、浜野さんは取り組んでくださるという。
復活なるまで、しばらくお待ちいただきたい。(倫)

2010年10月のアクセスランキング

本日公開した、10月分のアクセスランキングの数字は、いつもより大幅に少ない。
事故で、6日から24日分のデータを失った結果。
ごめんなさい。(倫)

林清俊さん登録作品の抹消

林清俊さん訳の「火星の記憶」「裁判」「私事広告欄」「ホロコースト・ハウス」「見えない光景」「山のねずみ」「幽霊書店」の登録を、お申し入れにより、抹消します。
林さん、これまで、ありがとうございました。(倫)

注記とXHTML版変換プログラムの調整

XHTML版は、テキスト版を自動変換して作っている。
今年、5月1日以降の公開分からは、変換時に用いるプログラムを、新しいものに切り替えた。
そこにみつかった誤りを修正し、本日公開の、三好十郎「天狗外伝 斬られの仙太」から、あらためたプログラムで作ったものに変える。

直した点は、次のとおり。
・metadataクラスの新設
ファイル冒頭のbody開始直後、main_textに入る前の作品名、著者名等を、新設したmetadataでクラス指定して、bodyに直接改行タグを書くことを回避。

・見出しタグの入れ子の修正
<a><hn>...</hn></a>となっていたものを、<hn><a>...</a></hn>に修正。

・midashi_anchor中のnameをidに置き換え
name属性を、id属性に置き換え。

・改行タグのバグを修正
ぶら下げ注記から、直接、字下げ注記に移行する部分の最初の段落の末に、改行タグが入らない問題を修正。

・ルビの付く文字の始まりを示す「|」のバグ修正
ファイル末の、bibliographical_informationと注記内の「|」が、変換後も残る問題を修正。

・<、>、&、"のエスケープ
本文中の<、>、&、"を、代替文字列に置き換え。(ただし、アクセント分解中の&をのぞく。)

・alt中の文字のへのタグ付けを停止
画像注記中の外字注記やアクセント分解等へのタグ付けを停止。

見出しタグの入れ子の修正に伴って、XHTML版の冒頭に目次を表示するプログラム(contents.js)が機能しなくなった。
これを、本来の正しい書き方に対応したものに、同じく本日、差し替えた。
あるべき姿にあらためたため、今度は逆に、5月以降、公開したり差し替えたりしたXHTML版の目次が、正しく機能しなくなった。これらは、順次、作り直す。

新しい変換プログラムを運用する中で、もう一つ気づいた問題があった。
ルビタグに変換するテキスト版の注記に、開始/終了型と呼んでいるタイプがない点だ。

それでどんな問題が生じ、それをどう解決するか、欠けている開始/終了型をどのように定めるかに関する議論の流れは、試験的に使い始めた共同作業場でみていただける。

この問題には、以下の開始終了型を新設して、対応することにした。

 [#(左に)注記付き]……[#(左に)「○○」の注記付き終わり]

検討は、点検グループに加えて、メーリングリスト、こもれび共同作業場、twitterなどで行われた。
共に考えてくださった皆さんに、お礼を申し上げます。

今回、何を変え、何を加えたかを、「注記一覧」に書かなければいけない。
組版案内」で利用でき、引き落とせるプログラムの、差し替えも求められる。
ただ、その前に、新設した注記を変換する機能の追加を片付けたい。

さらもう一点、変換プログラムに関して検討したい点がある。
共にルビタグに変換する振り仮名と注釈に、クラス名を与えて区別できるようにするか否かという問題だ。

「注記一覧」と「組版案内」は、これらの宿題をすませてから直したい。(倫)

追加する注記の書き方案の変更

ルビの形でつくけれど、親文字の読みではなく、注釈的な内容を示すものに、次の書き方を追加したいと、10月8日付けのそらもように書いた。

 [#(左に)ルビ注記]……[#(左に)「○○」のルビ注記終わり]

二週間とったレビュー期間に、「ルビ注記」という、青空文庫で今回工夫した言葉には、違和感があると意見が寄せられた。

では、どうするか。
読みを示す場合も、注釈的に付く場合も、紙の上では変わらず、「ルビ」と呼ばれてきた。
そうした使い方を踏襲するのか、使い方によって分けた方がわかりやすいか、双方からの意見があった。

何が何に付くかの関係を明らかにするために、「付き」を用いてはとの提案もあった。

それらを踏まえて、追加記法案を、次のように改めたい。

 [#(左に)注記付き]……[#(左に)「○○」の注記付き終わり]

既定の記法では、読みを示すものを「ルビ」、それ以外を「注記」と読んできた実績を踏まえて、今回追加するものでも「注記」を用い、提案のあった「付き」を採用した結果だ。

あらためてまとめれば、ルビのように付く注釈的な内容の注記には、以下の二つの書き方を用意する。

 既定 ……[#「……」(の左)に「○○」の注記]
 新設 [#(左に)注記付き]……[#(左に)「○○」の注記付き終わり]

両者の使い分けは、「外字注記やアクセント分解が、親文字や注記文字に含まれている場合は後者」とする。

これから一週間、30日までをコメント期間として、31日に、追加記法を決めたい。(倫)

種田山頭火の日記

本日10月11日は種田山頭火の命日。最後の日記「一草庵日記」を公開する。1930(昭和5)年9月9日に始まる、10年に渡る日記の全てが公開されたことになる。彼の自由律俳句を理解するのにも、役に立つことだろう。「一草庵日記」は、こう締めくくられている。
「夜、一洵居へ行く、しんみりと話してかへつた、更けて書かうとするに今日は殊に手がふるへる。」
日記は、10月8日で終わっている。(仙)

ルビタグに変換される注記に新しい書き方を追加

青空文庫のテキスト版には、レイアウトや強調用の記号などの情報が、注記を使って書き込んである。
紙の上でどうなっているものを、テキストにどう書くかは、「注記一覧」にまとめてある。
そこに、一つ書き方を追加したい。

語句の脇に小さな字でそえられた振り仮名を、ルビという。
青空文庫では、二重山括弧を使って、「青空《あおぞら》」のように書く。
このルビは、注釈的な内容にも用いられる。
疑わしいけれど、もとでは確かにそうなっていることを示す、「ママ」などがそれだ。
同じルビという形にはなるのだけれど、青空文庫では注釈にはルビ記号を用いず、別の形で書くと決めている。
追加したいのは、ルビの形をとる注釈の書き方の予備パターンだ。

これまでも、基本となる書き方は決めていた。
他の注記では、基本となる形に加えて、表示ソフトなどでの処理が複雑になる場合に備えた予備を設けていたが、これには欠けていた。
全体を見回したとき、ここだけ予備がないと、書き方に一貫性が生まれない。複雑なパターンを基本形でこなすのは厄介なので、表示ソフトを作る人への負担が大きくなりかねない。
そこで、補ってバランスをとろうと考えた。

どんな形に決めるかを、試験的に設けた共同作業場や掲示板、メーリングリスト、加えてTwitterなどで話し合ってきた。
どこを重視するかで意見が分かれたが、呼びかけ人、点検グループからは、以下の形を提案することにした。

 [#(左に)ルビ注記]……[#(左に)「○○」のルビ注記終わり]

追加の必要性と、検討の経過は、共同作業場の「テキスト版の注記」で見ていただける。

これから二週間、時間を取った後、書き方の決定へと進めたい。
ご意見があれば、この間にコメントをお願いしたい。
掲示板(こもれび)、呼びかけ人や点検グループ宛のメールなど、連絡方法は問わない。Twitterで#aozorabunkoのハッシュタグを使ってもらえば、見にいくようにする。(倫)

旧側図書カードとファイルの削除

9月27日で予告した、旧側図書カードとファイルを削除した。(倫)

重複した図書カードとファイルURLのへの対処

ある作品の図書カードとファイルの置き場所は、一つと決めている。
作品に、複数の著者や、翻訳者、編者などが関わっている場合も変わらない。

ところが、事情があって、公開後に関わりのある人物を追加した場合などに、複数の場所に置かれてしまうことがある。
このうちの一方は、いわば消し損ねで、誤りがみつかってファイルが修正された場合も放置され、もう一方のみが更新される。
消し損ねへのリンクがいつまでも残ったり、検索からそちらが開かれたりすると、不都合だ。

谷譲次と林不忘の二人が著者として関連づけてある「安重根」で、こうした事態が生じていた。
本来は存在しないはずの、旧側の図書カードとファイルを、10月に入った時点で、消去する。(以下に、新旧の図書カードのURLを示す。)

「安重根」
 新 http://www.aozora.gr.jp/cards/000272/card1805.html
 旧 http://www.aozora.gr.jp/cards/000290/card1805.html

同様の図書カードとファイルの二重配置が、09月13日付けで報告した、「著者なし作品の扱いの変更」によっても生じていた。
当日付けのそらもように掲げた旧側の図書カードとファイルを、同じタイミングで、消去する。(倫)

著者なし作品の扱いの変更

青空文庫の収録作品には、作家名を明示しにくいものがある。
それらに対する、索引上の扱いを変えた。
普段ウェッブブラウザーから開く上では関係のない、細かな話だが、何を、なぜ変更したか、お話ししておく。

著者を特定しづらく、作家名なしで登録したとしても、「総合インデックス」の「作品別」には、掲載される。
青空文庫の仕組みとしては、それで良いと思っていたが、利用が進むと不都合が生じるようになった。

その日、青空文庫全体で、何が公開されているかは、毎日更新している「作家別作品一覧(CSV形式)」で確認できる。
青空文庫を、さまざまなサービスの資源として活用しようとする人たちが、この「一覧」から、自分たち独自のリストを作るようになった。

「一覧」は、作家別に仕立ててあるので、著者なしではここに載らない。
載らない作品は、広がった利用の裾野で、存在しない扱いを受ける。
「そうなって困っている」と指摘を受けて、今回、次のように対処した。

憲法と法律には、「日本国」という著者を、新たにたてた。
 「警察官職務執行法」
 「大日本帝国憲法」
 「著作権法」
 「日本国憲法」
誰が書いたと特定できないその他には、「作者不詳」をたてた。
 「実語教」

さらに細かくなるが、もう少し話を続ける。
作者不詳ながら、翻訳などの関わりを持つ人物がいる場合は、その人が手がかりになって、これまでも「作家別作品一覧」に載ってきた。
ただ、載るにはのっても、大半の著者のある作品とは、管理番号の扱いにちがいが生じて、独自リストの作成に差し障りや面倒があった。
それらに対しても、新しく設ける「作者不詳」を著者としてたてれば、状況を改善できると考え、本日からそうすることにした。
 「アイヌ神謡集」
 「落窪物語」
 「「平家物語」ぬきほ(言文一致訳)」
 「法句経」
 「まざあ・ぐうす」

著者なしの作業中作品にも、同様に「作者不詳」をたてる措置を適用した。

今回の対処は、青空文庫側がほとんど何もしなくてすむ、小手先のものだ。
それでも、やれば「青空環境」の改善につながる。
データベースに蓄積されたファイルの管理情報、書誌情報を、全面的に、使いやすい形で提供する仕組みが用意できれば、広がり始めた利用の裾野は、さらにのびるだろう。
この先の課題が、はっきりみえた。

今回の変更に伴って、対象となった作品については、図書カードや作品ファイルのURLに、新しいバージョンが生まれた。
今後は、新しいものが正式。修正した際の差し替えも、こちらに対してだけ行われる。
ただ、すでにはられたリンクがあるだろうから、古いバージョンも当面、残すことにする。

参考までに、新旧図書カードへのリンクをはっておく。

「日本国」
 「警察官職務執行法」
   新 http://www.aozora.gr.jp/cards/001528/card2224.html
   旧 http://www.aozora.gr.jp/cards/000000/card2224.html
 「大日本帝国憲法」
   新 http://www.aozora.gr.jp/cards/001528/card825.html
   旧 http://www.aozora.gr.jp/cards/000000/card825.html
 「著作権法」
   新 http://www.aozora.gr.jp/cards/001528/card860.html
   旧 http://www.aozora.gr.jp/cards/000000/card860.html

 「日本国憲法」
   新 http://www.aozora.gr.jp/cards/001528/card474.html
   旧 http://www.aozora.gr.jp/cards/000000/card474.html
「作者不詳」
 「アイヌ神謡集」
   新 http://www.aozora.gr.jp/cards/001529/card44909.html
   旧 http://www.aozora.gr.jp/cards/000000/card44909.html
 「落窪物語」
   新 http://www.aozora.gr.jp/cards/001529/card672.html
   旧 http://www.aozora.gr.jp/cards/000000/card672.html
 「実語教」
   新 http://www.aozora.gr.jp/cards/001529/card409.html
   旧 http://www.aozora.gr.jp/cards/000000/card409.html
 「「平家物語」ぬきほ(言文一致訳)」
   新 http://www.aozora.gr.jp/cards/001529/card15937.html
   旧 http://www.aozora.gr.jp/cards/000000/card15937.html
 「法句経」
   新 http://www.aozora.gr.jp/cards/001529/card45958.html
   旧 http://www.aozora.gr.jp/cards/000000/card45958.html
 「まざあ・ぐうす」
   新 http://www.aozora.gr.jp/cards/001529/card546.html
   旧 http://www.aozora.gr.jp/cards/000000/card546.html
(倫)

牧野信一「滝のある村」の校正をご担当いただいている方にお願い

牧野信一「滝のある村」の校正をご担当いただいている方に申し上げます。

作業を引き継げないかとの打診を受けて、進捗状況とお気持ちの確認のためメールをお送りしましたが、お返事がありませんでした。
reception@aozora.gr.jp宛に、ご一報をお願いします。

本日から一ヶ月、ご連絡を待ちます。
一月を経て、連絡を取り合えない場合は、これらの入力を引き継いでいただこうと思います。

作業の継続が難しくなった際は、皆さん、どうぞお気軽に、reception@aozora.gr.jpまでご連絡ください。
メールアドレス変更の際は、reception@aozora.gr.jp宛にご一報をお願いします。(門)

「組版案内」を更新

組版案内」を更新した。
誰でも使ってもらえる、テキスト版をXHTML版に変換するプログラムを、最新版の「注記一覧」(2010年6月26日修正)に対応したものに差し替え、ダウンロード用の一式も作り直した。(倫)

「注記一覧」を更新

青空文庫本体においた、「注記一覧」を更新した。
これまで、階層を設定していなかった「同行見出し」と「窓見出し」を、大中小にレベル分けしたのが、大きく変えた点。
その他の変更点を含む詳細は、「修正履歴」を参照してほしい。

テキスト版をXHTML版に変更するプログラムも、今回の変更点に対応させた。
本日、同時に差し替えることができなかったが、「組版案内」においてあるプログラム、文書類も、続いて更新していく。(倫)

目次と圏点

5月1日以降の公開分から、見出しのある作品のXHTML版冒頭に、目次を表示するようにした。
ところが、当初用意していた目次生成プログラムがInternet Explorerで動作せず、多くの皆さんにこの機能を味わってもらえなかった。
それを、IEにも対応したものに変えた。
見出しの外字画像が、目次で欠けるという問題にも対処した。

傍点の類いの画像も、差し替えた。
強調のために文字にそえる点を、圏点と総称する。
底本で圏点のついた文字を、従来のXHTML版では一括して、太字にしてきた。
5月1日以降は、ここに示したそれぞれの形を、文字にそえるように変えたが、大きすぎ、目立ち過ぎとのコメントが、複数ついた。
そこで、小さめに作り直した。

新しい圏点は、戸坂潤「イデオロギーの論理学」で確認できる。
IEの方は、ここで目次もみてほしい。(倫)

折口信夫の「古代研究」一部三冊

本日公開された「国文学の発生(第四稿)」をもって、折口信夫の代表作である「古代研究」が全て公開されることになる。古代研究3冊は、「追ひ書き」の中で、折口自身が
「私は、柳田先生の追随者として、ひたぶるに、国学の新しい建て直しに努めた。爾来十五年、稍、組織らしいものも立つて来た。今度の「古代研究」一部三冊は、新しい国学の筋立てを摸索した痕である。」
と述べているように、折口の学問を概観するのにちょうどいい書物なのである。『古代研究 第一部 民俗学篇第一』『古代研究 第一部 民俗学篇第二』『古代研究 第二部 国文学篇』にはそれぞれ、以下の作品が収録されている。
『古代研究 第一部 民俗学篇第一』:「妣が国へ・常世へ」「古代生活の研究」「琉球の宗教」「水の女」「若水の話」「貴種誕生と産湯の信仰と」「最古日本の女性生活の根柢」「神道の史的価値」「高御座」「鶏鳴と神楽と」「髯籠の話」「幣束から旗さし物へ」「まといの話」「だいがくの研究」「盆踊りと祭屋台と」「盆踊りの話」「信太妻の話」「愛護若」「鸚鵡小町」「餓鬼阿弥蘇生譚」「小栗外伝 (餓鬼阿弥蘇生譚の二)」「翁の発生」「ほうとする話」「村々の祭り」「山のことぶれ」「花の話
『古代研究 第一部 民俗学篇第二』:「鬼の話」「はちまきの話」「ごろつきの話」「雛祭りの話」「桃の伝説」「まじなひの一方面」「狐の田舎わたらひ」「桟敷の古い形」「稲むらの蔭にて」「方言」「雪の島」「三郷巷談」「折口といふ名字」「神道に現れた民族論理」「大嘗祭の本義」「能楽に於ける「わき」の意義」「呪詞及び祝詞」「霊魂の話」「たなばたと盆祭りと」「河童の話」「偶人信仰の民俗化並びに伝説化せる道」「組踊り以前」「田遊び祭りの概念」「古代人の思考の基礎」「古代に於ける言語伝承の推移」「小栗判官論の計画」「漂著石神論計画」「雪まつりの面」「「琉球の宗教」の中の一つの正誤」「追ひ書き
『古代研究 第二部 国文学篇』:「国文学の発生(第三稿)」「国文学の発生(第一稿)」「国文学の発生(第二稿)」「国文学の発生(第四稿)」「短歌本質成立の時代」「女房文学から隠者文学へ」「万葉びとの生活」「万葉集の解題」「万葉集のなり立ち」「万葉集研究」「叙景詩の発生」「古代生活に見えた恋愛」「古代民謡の研究」「日本書と日本紀と」「相聞の発達」「日本文章の発想法の起り」「お伽草子の一考察
最後に、入力、校正に携わってくださった全ての方に感謝します。(門)

訂正報告

昨日付のそらもように、誤りがあった。
また、目次生成プログラムが、InternetExplorerで動かないという問題を見逃していたので、報告する。

三好十郎「地熱」のXHTML版で、傍点が表示されると書いたが、この作品には傍点は用いられていない。
動作チェック用に用いていた、若杉鳥子「烈日」と取り違えた。
同作品のXHTML版で、傍点を確認してもらえる。

本文冒頭の目次生成と、ファイル末尾の図書カードにもどる機能は、JavaScriptで実現している。

ウェッブブラウザーでJavaScriptがオンになっていないと、これらの機能は使えない。(設定方法は、たとえばYahoo! JAPANのこのページなどで解説されている。)

ただ、JavaScriptがオンになっていて、図書カードには戻れるのに、InternetExplorerでは、目次が表示されない。
現在、使用している目次生成用のcontents.js(「組版案内」のダウンロードから引き落とし可能。)にはすでに、修正すべき他の問題も確認されているので、合わせて対応を検討する。

Firefoxの最新版(現時点では3.6)では、目次の動作不良は、確認されていない。
どのように動くか確かめたい方は、取りあえず、こちらで試してほしい。(倫)

公開ファイル仕切り直し

本日の公開分から、テキスト版を「注記一覧」に対応させ、XHTML版を、新しいプログラムで作ったものに切り替える。

入力のもとにする本の字面を追うと、書体や文字サイズに変化が付けてあったり、字下げや字詰めされていたりするのに気づく。
成り行きによらないページの切り替えや、ルビと呼ばれる振り仮名、漢文にそえられた、返り点や送り仮名にも出合う。
青空文庫では、そうした組版にかかわる情報も、「これはこんなふうに書く」と約束事を決めて、入力してきた。

ルールは、作業を重ねる中で、少しずつ固めた。
そのために、複数の資料に情報が分散したり、採用と決めて使い続けながら、未記載のままにしていたものがあった。
それをまとめたのが、「注記一覧」だ。
取りまとめにあたっては、全体を見渡してバランスを調整し、決めていなかった要素を補った。

XHTML版はこれまでも、テキスト版の注記をプログラムでタグに変換して作ってきたが、誤動作や特定のパターンでの停止など、問題を抱えていた。
一部の注記は、タグに置き換えずに素通しさせてきた。
今回「注記一覧」のまとめと並行して、これに対応させる形でプログラムを作り直し、タグへの置き換え対象を広げた。

あらためた点の詳細は、「テキスト版注記と XHTML 版の変更点」で説明している。
このタイミングで作業した意図は、4月1日付の本欄「「注記一覧」の採用と「組版案内」の公開」で述べた。

その成果を、今日から見ていただく。

本日公開した「地熱」のXHTML版を開いてまず目につくのは、目次だろう。
頭に付いている「+」のクリックで、折り畳まれていた目次が開く。項目をクリックすると、本文中の、当該の見出しにジャンプする。

傍点が表示されているのに、気づかれたろうか。
これまでウェッブブラウザー上では、傍点付きを、その種類を問わず一括して太字で、傍線付きをまとめて、下線付きの斜体で表してきた。
それを今後は、底本どおりの形で示す。
現時点では、文字と傍点の対応が微妙にずれるが、表示の細部を決めるCSSの次世代規格が広く普及した段階では、この問題は解消できると考えている。

ファイルの末尾には、「●図書カード」の文字が加わった。
クリックで、その作品の図書カードにとぶ。
検索エンジンなどからXHTMLファイルを直接開くと、図書カードへはこれまで、トップページを迂回してたどるしかなかったが、近道が付いた。

本日の公開分には含まれていないが、従来は注記のまま残っていた罫囲みや字詰めも、タグ化して表示に反映させる。

テキスト版で目につくのが、見出し回りの注記だろう。
ごちゃごちゃとうるさいが、これがあればこそ、リンク付きの目次を、取りこぼしなくつくれる。
大中小、どのレベルの見出しかを書いて、作品の構造をより忠実に伝えるメリットの方が、煩雑さのデメリットより大きいと判断して、採用に踏み切った。

今回の変更で、青空文庫のファイル形式を、改善できると考えている。
ただしそのために、書き方を一部変更し、これまでなかった要素を加えた。
青空文庫のファイルを縦組で表示して、注記やタグを手がかりに底本の組みを再現するソフトが、たくさん開発された。
従来のルールに対応したそれらで、本日以降の新しいファイルを開くと、表示の一部に問題がでる。
青空文庫のXHTML版では、あらかじめ目次生成プログラムを用意したが、こうしたモジュールなしでは、そのメリットは得られない。

表示ソフトで読むなら、今後、変更に伴うトラブルに、繰り返し出くわすだろう。
この問題は、青空文庫側のルール変更によって生じたことを、ご理解いただきたい。
表示ソフトの開発にあたられる皆さんには、新しい形式への対応をお願いしたい。

http://mirror.aozora.gr.jpでは、目次の自動生成と、図書カードに戻る機能なしで、XHTML版を公開する。
これらは、JavaScriptで実現しているが、ミラーサイトは、プログラムを動かさないことを条件に、ON TV Japanに使わせていただいてきた事情による。

最終段階での調整を反映した「注記一覧」と「組版案内」の更新を、本日に間に合わせたかったがかなわなかった。
もう少し、時間をいただきたい。

ファイルと関連文書が整い、表示ソフトの対応が進めば、この形式の“生態系”が、わずかばかり進化する。
これでテキストを用意すれば、さまざまな機器向けに開発された青空文庫ファイル表示ソフトを、自分の電子出版の道具として、丸ごと利用できる。
XHTMLへの変換プログラムなら、「組版案内」に置いてある。

路傍の雑草だが、陽と水に恵まれるなら、せいいっぱい育てばいい。
摘み取る手があれば、息ひそめて世の片隅を飾れ。(倫)

永遠の終わり、そして無限の始まり

 本日、トップページ下にあるカウンターは9000を越えた。10000という数字にも来年の夏頃には届く事だろう。これからの1000のファイルはほとんどが、4月1日に公開になった「注記一覧」に基づいて作られることになる。あと二日で新しい形式のファイルをお手元に届けることが出来る。新しい「注記一覧」とそれをもとにしたxhtmlファイルの魅力を知ってもらえることだろう。
 この「注記一覧」は、2002年に始まった取り組みの総仕上げと見る事が出来る。2002年4月18日2002年5月7日のそらもように、その目指すところが明確に示されている。すなわち、読み易さを考慮したエキスパンドブックという形式をやめ、テキストとそれに基づくxhtmlファイルによる作品の公開である。個人的な感想になるが、最初に青空文庫を知って驚いたことがこのエキスパンドブックという形式の美しさであった。これなら、コンピューターで読書ができる、と思わせるものだった。2002年に採用された方針は、「汎用的」を最優先に、そして「すぐに読める」を派生的に生み出すというもので、「読みやすさ」は切り捨てられることとなった。しかし、その後の電子書籍の発展とビューワーの発展は目覚ましかった。想像を超える動き方をした。携帯端末で読書をする未来にこれほど早くたどり着くとは、誰も思っても見なかったことだろう。「読みやすさ」はビューワーの発展によって、補ってもらうことが出来たと思う。
 さて、現在のように携帯端末が発達し、電子書籍を巡る情況も一変してしまった時に、現在の青空文庫が用意しているファイル形式をもう一度見直してみよう。青空文庫が用意するのはテキストファイルとxhtmlファイルである。テキストファイルには、「注記一覧」に示されているように、書籍である作品の状態を可能な限り反映させた注記が盛り込まれている。これが、テキストファイルを直接読む方々には読みにくいので不評かもしれない。しかし、この「注記」があるからこそ、「注記」に対応したタグを含んだxhtmlファイルを作成することが可能なのである。xhtmlファイルのタグに対応したビューワー(azurなど)を使えば、もともとの書籍にかなり近いものが表示できるのである。すなわち、テキストファイルの注記とxhtmlファイルのタグは、書籍をデジタルで蘇らせるためのツールのようなものである。
 一度出版された書籍は、きちんと保管すれば百年以上も保持出来るものである。かなりの数の稀覯本があることを考えると、「書籍とは永遠」と言っても過言ではない。しかし、利用の観点から考えると、永遠の保存は利用に背を向けたものであるだろう。書籍のデータを抽出し、テキストファイル、xhtmlファイルを作することは、書籍に無限の可能性を与えることではないだろうか。願わくば、無限の可能性が永遠に保証されんことを。(門)

「青空文庫 全」の配布を終了

2007年7月、青空文庫は10周年の集いをもった。
そこで、全国の公共図書館に、青空文庫の丸ごとをおさめたDVD-ROM付き冊子「青空文庫 全」を送る計画を発表した。
その狙いは、提案者の門田裕志さんによる「寄贈計画に寄せて」にくわしい。
計画の進捗状況は、「お知らせ」で報告してきた。

残部がほぼなくなって、今年1月1日からは、トップページからの「お知らせ」へのリンクを外していた。
そして、昨日送った分で、配布可能なものが、とうとうつきた。
そこで、「お知らせ」にその旨を記載し、そらもようで配布の終了を宣言することにした。

この計画は、社団法人日本図書館協会、ライブラリー・アド・サービス、国際交流基金情報センターライブラリー他、たくさんの方々に支援していただいて進めたものだ。
あらためて、心からお礼を申し上げます。
「欲しい」と声をかけてくださった皆さんも、ありがとう。(倫)

「注記一覧」の採用と「組版案内」の公開

1月1日に「((案))」として示した「注記一覧」を、修正の上、本日付けで作業方針とする。
「(案)」からの変更点は、目次注記新設要望への対応と、この形式を、青空文庫外のファイルに採用した時、必要になりそうな要素の追加。
従来の記法、タグとの相違点は、「テキスト版注記と XHTML 版の変更点」にまとめている。

本日からは、「注記一覧」を作業のよりどころとしてほしい。

対応ファイルへの切り替えは、5月1日公開分からを予定している。
表示ソフトの開発者各位には、「注記一覧」の記法とタグにより広く対応してくださるよう、お願いしたい。
なお、公開済みのファイルは、従来通りの形式で残る。少しずつでもあらためたいが、長く共存が続くだろう。

この間、入力、校正にあたってくださっている方、ソフト開発者他の皆さんから、さまざまなご意見を頂戴した。
あらためて、ご検討とコメントに感謝します。

「注記一覧」のとりまとめとあわせて、テキスト版をXHTML版に変換するプログラムの、Rubyによる書き直しを進めた。
堅牢性を高めることに加えて、これまできっちりと処理してこなかった、罫囲み、字詰め、横組みなどをタグ化し、文字サイズ、太字、斜体などの不適当なタグ付けをあらためた。傍点、傍線は、ブラウザー上で、そのものの形を示すようにした。新設した見出しタグを手がかりに、リンク付きの目次を自動生成する機能や、かねてから要望のあった、作品ファイルから図書カードに戻る機能を組み込んだ。
一からの開発にひとしい作業には、藤井遼さんがあたってくれた。素人の無茶な要求を取捨選択し、斬新なアイデアを次々に盛り込んで、最後には安定したプログラムに落着させたお働きに、あらためて心からお礼を申し上げます。

この変換プログラムを利用してもらう場として準備した「組版案内」も、今日から公開する。
ウェッブブラウザーから、誰でもテキストをXHTMLに変換してもらえるほか、パブリックドメインとしたプログラムも、ここで引き落とせる。

「組版案内」の「ダウンロード」には、変換プログラムに加えて「「注記一覧」記入例」というテキストファイルを置いた。「注記一覧」に例示したパターンがまとめてある。
これ、もしくはこれをXHTMLに変換したものを表示ソフトで開けば、青空文庫注記とタグへの対応度がみえるだろう。

青空文庫側への連絡先として、「組版案内」では、コメント欄を交流の場に向けて拡張するような、Disqusという仕組みを指定した。

青空文庫の主要な課題は、著作権切れ作品を中心にテキスト化して、インターネットで公開することにある。ここにたくさんの作業課題を残しながら進めた「組版案内」は、いわば追加の新規事業だ。そのために割けるような余力は、本来なかった。

こうしたプログラムを公開すれば、利用上の疑問が、たくさん生じるだろう。けれど、それに逐一答えられる自信は、率直に言ってない。ならば、利用する方相互の情報交換に頼れないかと考えた。

私たちは、言葉による表現をテキスト化し、インターネットに上げようと考えた。
そうすれば、文字に刻まれた表現と知識に、検索と参照の大きな網をかけられる。

あおぎさえすれば、青空のぬくもりには、誰もが、どこにいてもあずかれる。
信頼を得た言葉の決して忘れられることのない、雲に隠れることもない、「読みたい」と願う、誰の視線もはばまない環境を作りたいと願った。

そんな夢を見た人の力が集まって、青空文庫には作品ファイルが集まった。
そのファイル群を読みやすく、快適に表示するソフトウエアが書かれた。

そうなって気づいた。
テキストを青空に運ぶために用意した注記、タグのルールをよりいっそう明確化すれば、表示するソフトウエア群と足並みをそろえて、この環境を強化できる。
青空にテキストを運ぶためのはしごを、より確かなものにできる。
そして、そのはしごは、青空文庫以外にも利用してもらえる可能性がある。

電子出版が、話題を集めている。
表示端末として使える、新しい装置に、注目が集まっている。
確かに、魅力的だ。素晴らしい。私も使いたい。
だが、本の未来の核心は、視線と向き合う表層にはない。
言葉に、系統だった検索と参照の網をかける、背後の構造にこそある。
その構築に向けて、さまざまな試みが積み重ねられて行くだろう。
青空で育ったこの小さな仕組みが、空にテキストを運ぶ大きな課題の中で、多少なりとも寄与することを願いながら、「注記一覧」と「組版案内」を準備した。(倫)

魚座の最後の日に公有のバトンをうけとった

片岡義男「ラハイナまで来た理由」を登録した。

この十年ほど、片岡義男さんの主に小説の編集を担当している。いまも新しい短編小説集が進行中だ。その打ち合わせのあるとき、片岡さんが言った。「ぼくの小説を青空文庫に載せてください」と。「ぜひ!」と即答したかったけれど、できなかった。越えなくてはならないハードルが少なくとも二つあったからだ。

ひとつは現在のところ青空文庫は著作権存続中の作品の登録を受け入れていない、というハードル。受け入れるための態勢が整っていないという事情でやむなくそうしているわけで、著作権ありの作品の登録は大きな懸案事項であり続けている。著作権を保護しながら著作物の活用をうながす約束事として、すでに広く世界で使われているクリエイティブ・コモンズを活用しながら、なんとか打開の方法を見つけていきたい。

もうひとつのハードルは出版社の持つ権利をどう考えるかということ。今はもうない出版社のものなら問題はなさそうだ。出版社がなくなると同時に権利も消滅している。80年代に書店の本棚にずらりと並んでいた片岡さんの赤い背表紙や青い背表紙の文庫本は姿を消してから久しいし、出版社のサイトで検索してみても一冊もヒットしない。絶版状態ととらえていいのではないか。公開しても問題のないものは相当ありそうだ。

「片岡プロジェクト」は片岡さんの申し出を大きな機会ととらえて、ハードルを越えるためにスタートを切った個人的なこころみだ。絶版となっている底本を選び、ファイルにはクリエイティブ・コモンズのライセンスを組み込んだ。二つのハードルをまだ完全に越えてはいない実験段階だが、越えた先の明るい景色はかいま見える。著作権ありの作品が青空文庫の蔵書になっていく。かつて出版され、出版社の都合などで容易に手に入らなくなっている本が青空文庫でよみがえる。先はまだ遠いかもしれないけれど、「ラハイナまで来た理由」の登録・公開がそのための一歩となればうれしい。片岡さんの小説は継続して登録していく。読者が小説を待っているように、小説も読者を待っているのだから。

きょう、2010年3月20日は片岡さんの70歳の誕生日であり、青空文庫でのデビューの日ともなった。ファイルの最後に置いた「このファイルは、著作権者自らの意思により、インターネットの図書館、青空文庫に収録されています。」という一文に続く「あとがき」のような以下の文章を片岡さんが寄せてくれた。(八巻)

-------------------

丸にCの字を書きたくて

落書きのためのスペースは教科書の欄外余白だった。本文ごとに、つまりどのページにも、左右そして上下に、ここに落書きをしなさいと、僕を誘ってやまない余白があった。上下の余白は横長のスペース、そして左右のスペースは縦長であり、幅は狭いけれども縦につながり横に広がり、四方をぐるっと取り囲んでもいる余白は、まさに落書きのためのものだった。表紙と裏表紙のそれぞれ内側は、腕の見せどころの入魂のタブローのための、特別なスペースだった。

そして落書きのための時間は、授業中がもっとも好ましかった。それ以外の時間にどこへ落書きしようとも、なぜかあまり面白くなかった、という体感が記憶の底にかすかにある。授業中の生徒がなにをしているのか、教壇の先生からはよく見えた。前の席の女性の背中に隠れて、教科書の余白に落書きに余念がないという至福の時間に、「おい、カタオカ、なにしてるんだ」と、先生の声が終止符を打っていた。

教科書一冊全ページの余白に連続漫画を、授業中の時間を使って描き上げたのは、一九五三年のことだった。手塚治虫の漫画を古書店でかたっぱしから手にいれ、夢中で読んでいたことのなかから、僕の余白漫画は生まれてきた。手塚の何年か前、『不思議な国のプッチャー』という、最初のアプローチがあるのだが。教科書まるごと一冊の余白に描いた漫画は、その余白をすべて切り取り、一冊のノートに順番に貼りつけた。いまの僕の日常語で言うなら、本にまとめた、ということだ。縦のつながりと横のつながりが交互する、いま思えば斬新な表現形態の傑作だった。タイトルは『おい、カタオカ』とした。

第二巻も作った。タイトルは『こら、カタオカ』だった。第三巻は『なんだ、カタオカ』といい、これも完成させた。余白漫画の三部作だ。三冊のどのノートの表紙にも、タイトルと僕の名前に加えて、丸のなかにCの字の、マルシー、つまりコピーライトを、添えた。これを書き込むときには、晴れがましい気持ちになった。Cの字はコピーライトという英語の言葉の頭文字だと知っていたし、日本語では版権と言うのだ、ということも知っていただろう。

僕が作った三部作に刺激を受けて、僕よりはるかに漫画のうまい同級生が、年末近く、次の年のためにおそらく父親が用意しておいた日めくりカレンダーを使って、三百六十五ページの大作漫画を仕上げた。じつに面白い漫画だった。表紙には題名と彼の名、そしてマルシーとその年号が、これは誇らしげに太く大きな書体で、書き込まれていた。

中学の一年生にして、僕たちふたりはマルシーを持ったのだ。僕のマルシーに刺激されて、彼のマルシーが生まれた。マルシーは共有される。共有されることによって、新たな価値を生み出す。(片岡義男)

公有のバトンをつなぐこと

本日、拙訳による「あなうさピーターのはなし」ほかベアトリクス・ポッター(ビアトリクス・ポター)の4作品が青空文庫に登録された。翻訳の底本となるのは、1902年からおよそ10年のあいだに連続刊行された動物絵本で、一般的には「ピーターラビット(となかまたち)」の名称で知られている。

これらの本は、その出自から著作権と密接な関係を有している。もちろん著者本人が「著作権ビジネス(ライセンスビジネス)の祖」と呼ばれることもひとつだが、何よりもまず、彼女の人生にとって「著作権」がある種の武器として存在したことである。

両親が揃って成金の二代目というポッターは、箱入り娘というよりも「箱に入れられた娘」だった。同年代の友だちもほとんどなく、外へもあまり出られず、自由になる金銭もない。それゆえ内緒で手に入れた動物たちや狭い行動範囲にある植物・菌類と戯れることが多く、それが唯一の慰めでもあった。しかし彼女はそんな箱を抜け出したいと思い、自立のためのお金を稼ごうと考える。動物のイラストを描くイラストレーターとして出発し、そしてしっかりとビジネスとしての算段を立てた上で初めての本を自費出版する。それが The Tale of Peter Rabbit であり、狙い通りに好評を得られ、続く一連の絵本はのちに婚約者となる人物の出版社から刊行されていくこととなる。

創作という手段によって自立を図ろうとしたこの女性は、婚約者の死や家族との反目のなかで挫折を繰り返しつつも、果てには自由と成功を手にして、やがてイギリスの湖水地方で農婦としての静かで充実した生活を手に入れる。1作目の主人公 Peter Rabbit の冒険は失敗に終わるが、10年という短い創作期間の終わりである20作目では、主人公の Pigling Bland は絶望的な状況からの逃亡に成功し、新たな伴侶を得て旅立つ。彼女にとって創作はセカイと戦う手段であり、そしてその力によって最終的に自立を成し遂げる。その戦いに協力したのは、創作・精神両面で常に彼女を支えた動植物たちだ。

彼女は自己実現のためにしたたかで強力なビジネスを組み立て、そして自分の(仲間たちの)居場所を保全するために安定した稼ぎを必要とした。その行動の保障をしたのは、疑いようもなく「著作権」である。だからこそ彼女はこの権利を意識的に使い、その人生を活かしきった。

その彼女が死んですでに60年以上が経過している。その権利は彼女の死とともに立派すぎるほどにその役割を終え、また作品の力によって世界じゅうに知らしめられた湖水地方は、彼女がいなくともしっかり守られていくだろう。作品が愛されれば愛されるほど、その舞台も永遠に残される。

しかし一度成ったビジネスの利権は、著者の意志や遺志に関係しようとしまいと、亡霊のように生き続ける。弁護士の福井健策氏の言う「疑似著作権」とは、そのひとつの現れである。自由のために戦った動物たちは、今やまた囚われの身である。ピーターラビットと同様にビアトリクス・ポターも商標であるのなら、彼女自身もまたそうなのかもしれない。

すでにアメリカの複数のテキストアーカイヴでは、これらの作品が公有であるとして公開されている。自由であると、青空のもとにあると。ならばここで日本も手を挙げよう。そしてその公有のバトンを受け取ろう。

今日登録された4作品はその想いのリレーであるとともに、また青空文庫にとって実質初めての本格的絵本でもある。絵本をデジタルでアーカイヴすることは、テキストのみの場合よりもさらに課題が増える。今回は海外のテキストアーカイヴから画像を流用しているが、画像のスキャンの品質ややり方とも、常に向き合っていかなければならない。

だがアーカイヴ作業を積み重ねていくことでしかその解決へ向かうことはできないし、今後もそうしていくつもりである。願わくは、同じくこの作業に挑む者が現れんことを、そして海外の絵本だけでなく日本の絵本をも公有アーカイヴされんことを。(U)

人物名データにおける旧字名の削除

2010年02月03日のそらもように提案されている通り、人物名データにおける旧字の名前を削除することとした。青空文庫では、図書カードなどに記載する人物名は、新字でとっていることに基づいた対処である。削除した旧字の人物名は、以下の通り。
芥川 龍之介、巖谷 小波、植松 眞人、尾形 龜之助、小栗 蟲太郎、小澤 真理子、葛西 善藏、國木田 獨歩、黒島 傳治、桑原 隲藏、齋藤 緑雨、三遊亭 圓朝、世阿彌 元清、談洲樓 燕枝 二代、坪内 逍遙、徳田 秋聲、野上 豐一郎、濱尾 四郎、平野 萬里、廣津 柳浪、北條 民雄、細井 和喜藏、穗積 重遠、穗積 陳重、堀口 九萬一、眞山 青果、水上 瀧太郎、宮澤 賢治、與謝野 晶子、與謝野 鉄幹、與謝野 寛、與謝野 禮嚴、渡邊 温

また、他に以下の修正を行った。
・旧字でのみ登録されている人物名(荻原 守衞、杉山 萠圓、萠圓、萠圓山人)を新字へと直した。
・人物名の読み方の違いで二つ登録されている「尾佐竹 猛」(おさたけ たけき/おさたけ たけし)については、「おさたけ たけき」の読み方の人物名が正しいものとして、もう一つの人物名データを削除した。

(門)

田中貢太郎の学研M文庫「日本怪談事典」底本の56編の入力をご担当いただいている方にお願い

田中貢太郎の学研M文庫「日本怪談事典」底本の56編の入力をご担当いただいている方に申し上げます。

作業を引き継げないかとの打診を受けて、進捗状況とお気持ちの確認のためメールをお送りしましたが、お返事がありませんでした。
reception@aozora.gr.jp宛に、ご一報をお願いします。

本日から一ヶ月、ご連絡を待ちます。
一月を経て、連絡を取り合えない場合は、これらの入力を引き継いでいただこうと思います。

作業の継続が難しくなった際は、皆さん、どうぞお気軽に、reception@aozora.gr.jpまでご連絡ください。
メールアドレス変更の際は、reception@aozora.gr.jp宛にご一報をお願いします。(門)

「記載事項」を修正

青空文庫収録ファイルへの記載事項」を更新した。
ここには、作品自体に加えて、どんな要素をテキスト版に記載するかが示してある。
これに対し、「説明が不十分で、判断がつかないところがある。」との指摘があったので、解説を補充し、記載例を手直しした。

一点、新しく付け加えた要素がある。
横組みの底本を利用した際、これまではその旨を注記したりしなかったりと、ばらばらだった。
これからは、文言を決めて「※底本は横組みです。」と必ず書くことにする。

記載用テンプレートも、あらためた。
作業してくださっている方には、差し替えをお願いしたい。(倫)

人物名データにおける旧字の扱いの変更について

人物名データにおける旧字の扱いの変更を検討している。
作品ファイルの話ではない。図書カードなどに記載するためのデータだ。

青空文庫では、図書カードなどに記載する人物名は、新字でとっている

ただし、「旧字表記が一般的なもの」については、新旧双方で登録している。
旧字からは新字に送りがかけてあるだけで、作品は関連づけられておらず、実質的に、旧は機能していない。

ではあるが、着手連絡システムの「人物一覧」には旧字も表示され、時にこちら側で新規作品登録が行なわれては、その都度、混乱をきたす。

そこで、旧字での人物登録は取りやめ、既存のデータは、削除してはと考えた。
この措置に伴って、「青空文庫における書誌データのとりかた」の【人物名】の以下の項を廃止しようと思う。
・旧字表記が一般的なものは、新字に加えて、旧字でも「人物登録」を行う。
「芥川竜之介」に加えて、「芥川龍之介」も登録する。
「与謝野晶子」に加えて、「與謝野晶子」も登録する。
・旧字表記による作家名には、新字によるものを、「人物基本名」として設定する。
・「人物基本名」の設定により、「登録全作家 作家リスト」に見るとおり、「子」となる旧字側から「親」となる新字側に送りがかかる。
・新旧関係によって生じた「親」「子」関係では、「親」側にすべての作品を寄せる。
この変更に、不都合を感じられる方は、reception@aozora.gr.jpまで、コメントをお願いしたい。(倫)

第10期(2008年9月1日~2009年8月31日)会計報告

青空文庫第10期の会計報告を公表します。
第10期は広告収入は減っておりますが寄付をいただく機会に恵まれました。
またサーバを預かっていただく業者さんを変更した事により費用を抑えることができました。
寄贈に関する費用は荷造運賃としております。(青空文庫会計部)

久生十蘭「虹の橋」の入力をご担当いただいている方にお願い

久生十蘭「虹の橋」の入力をご担当いただいている方に申し上げます。

作業を引き継げないかとの打診を受けて、進捗状況とお気持ちの確認のためメールをお送りしましたが、連絡を取り合うに至っていません。
reception@aozora.gr.jp宛に、ご一報をお願いします。

本日から一ヶ月、ご連絡を待ちます。
一月を経て、連絡を取り合えない場合は、入力を引き継いでいただこうと思います。(倫)

トレンドイーストによる校正支援

本日公開の、里村欣三「放浪の宿」の入力は、林幸雄さん。校正は、トレンドイーストさんにご担当いただいた。
林さんが作業の仲間となって、もう10年近い。この間、途切れることなく、入力、校正してくださった。一方、校正ご担当にとっては、この作品がはじめての公開分だ。

「トレンドイースト」は、個人のハンドルネームではない。社名だ。カシオ計算機の電子辞書で、青空文庫を読めるようにする話でご縁ができた。
著作権が切れたものなら、有償、無償を問わず、ファイルは自由に使ってください、と言っている。同社にもそう申し上げたが、我々もなにかできないかと言ってくださった。

作業中 作家リスト:全て」の見出し下からダウンロードできるcsvファイルを開くと、入力ずみのたくさんの作品が、校正を待っている状況を確認できる。入れた方には、お詫びのしようもないが、中には10年近くも校正待ちが続いているものさえある。
校正者不足は、スタート当初から青空文庫が抱えている課題だ。
その旨断って、校正なしで公開することが何度も話に出たが、間違いをできるだけ減らすことを優先して、これまでは省かないできた。
その私たちの弱点を、同社が補ってくださることになった。今後、継続して、トレンドイーストは青空文庫を校正で支えてくださる。

里村欣三「放浪の宿」も、実は林さんが青空文庫に加わって間もない頃に入れながら、長く公開できなかったものだ。
今回、同社校正ご担当の働きを得て、公開にこぎ着けることができた。

著作権が切れたとしても、誰も作業しなければ、パブリック・ドメインのファイルは永遠に生まれない。
新しい仲間が加わり、働きがようやく繋がって、「放浪の宿」を公有の青空に放つことができたことに、感謝したい。(倫)

ハッピー・パブリック・ドメイン・デイ!

1月1日を、パブリック・ドメイン・デイと呼ぶ人がいると知った。

2010年の元日に向けて、青空文庫では、阿部次郎「帰来」、石川欣一「可愛い山」、伊藤永之介「押しかけ女房」、北大路魯山人「雑煮」、高浜虚子「子規居士と余」、橘外男「雷嫌いの話」、豊田三郎「リラの手紙」、永井荷風「日和下駄」を用意していた。
この呼び名とその由来を知って、トップページを工夫し、そらもようで紹介しようと思い立った。

すべての表現には、生み出した人がいて、作品に対して特別な権利を認めらている。
例えば日本の著作権法は、文芸、学術、美術、音楽に属して、「思想又は感情を創作的に表現したもの」に権利を認め、保護すると定めている。

権利には大別すれば、財産権と人格権の二つがある。
パブリック・ドメインとは、このうちの財産権の主張が、誰によってもなされない状態を指す。
少しこなれは悪いが、「公有」の訳語が与えられることもある。

パブリック・ドメインとなる事情にはいくつかあるが、代表的なのが、保護期間を過ぎることだ。
財産権は永遠に認められるわけではない。一定の期間を過ぎれば、保護の縛りがなくなり、誰でも自由に利用できるよう制度設計されている。
作品の利用に独占的な権利を認め、それで儲けられるようにしておくことには、作者を経済的に支え、創作が活発に行われる下地を用意する効果がある。
だが、作者が他界すれば、保護はもはや創作の支援とはならない。
ならばそこでは、縛りをはずし、利用を促そうとする仕組みは、理にかなっている。

国の境をこえて、著作物を保護する枠組みに、ベルヌ条約がある。
日本は1899(明治32)年から加盟しており、ウィキペディアによれば、2008年10月時点で、163箇国がこれに加わっている。

そのベルヌ条約には、保護期間算定の区切りを1月1日とする規定があり、加盟国の国内法でも、境目はこの日に置かれている。
パブリック・ドメイン・デイが、世界の記念日となるゆえんだ。

パブリック・ドメイン・デイを紹介するにあたっては、日本語をあてようかとも思った。
寄せられた候補には、「国際共有デー」「共有記念日」「青空記念日」などあったが、「共有感謝の日」が呼び水となって、「作品感謝の日」「創作感謝の日」というアイディアが生まれた。
彼らが作家として立って、死後50年を経てなおテキスト化を誘う作品を残してくれたこと。それを青空文庫に集う人たちが、力を合わせてテキスト化できたこと。そして節目の日以降、その成果を皆のもの扱いして良くなったことのすべてに感謝しようという趣向だ。
この日からは、彼らの作品を誰に断ることなくインターネットで公開もできれば、紙の本にもできる。
翻訳も、朗読も、上演も、楽曲なら、演奏もできる。
原作を下敷きに新しい作品をまとめる翻案も、自由になる。

青空文庫がスタートした1997年には、伊丹万作、小栗虫太郎、河上肇がパブリック・ドメイン入りした。
以来1998年には、織田作之助、幸田露伴、横光利一。
1999年、菊池寛、太宰治、小島烏水。
2000年、海野十三、佐藤紅緑、田中英光。
2001年、野上豊一郎、楠山正雄、金史良。
2002年、宮本百合子、原民喜、林芙美子。
2003年、久米正雄、土井晩翠。
2004年、斎藤茂吉、峠三吉、堀辰雄、折口信夫。
2005年、岸田国士、相馬愛蔵。
2006年、坂口安吾、下村湖人、豊島与志雄。
2007年、高村光太郎、佐藤垢石、邦枝完二。
2008年、神西清、久生十蘭、牧野富太郎。
2009年、徳永直、木村荘八、三好十郎と続いた。
こうして振り返ると、青空文庫で広く親しまれている作家のかなりが、ここ10年ほどでパブリック・ドメイン入りしたことが確認できる。
そして日本の節目の日は、ご紹介したとおり、今年も豊饒だ。

だが、この日が区切りとなる事情に変わりはないものの、ヨーロッパやアメリカの今日は、それほどめでたくはない。
EU加盟国の多くは長く、著作権の保護期間をベルヌ条約の基本設定である死後50年までとしてきた。
だが、1993年、統合に向けて制度をならすために、域内の最長の国に合わせて70年にすると決めた。延長された保護期間は、過去にさかのぼって適用されたため、いったん切れていた作家の権利の多くが復活することになった。
延長からいまだ20年を経ていない現在、EUのパブリック・ドメイン・デイの中心は、権利がよみがえった作家の、再著作権切れにとどまっている。

キャラクター保護を狙う娯楽産業などからの圧力を受けたアメリカは、EUを追って、1998年に70年延長を決めた。以後20年を過ぎる2019年まで、この国では、新しく著作権切れを迎える作家が生まれない。
パブリック・ドメイン・デイを失った状態が、なお10年近く続く。

そして残念なことに、日本の保護期間事情も、けっして安閑としていられるものではないのだ。
文部科学省の文化審議会著作権分科会は、保護期間に関する小委員会を設けて、2007年3月から延長問題を論議したが、さまざまなデメリットが具体的に示される中、2009年1月には結論を先送りする形でこれを見送った。
ところが同年の11月になって、日本音楽著作権協会(JASRAC)の70周年記念パーティの席上、鳩山由紀夫首相は突然、70年延長実現に向けて最大限努力すると述べた。

2010年1月1日時点で、保護期間がすでに死後70年までに延長されていたとすれば、今日公開した作品は、当然一つとして読んでもらえない。
50年を守り通せばその後20年間に公開できたはずの、火野葦平、賀川豊彦、岸上大作、和辻哲郎、小川未明、柳田国男、吉川英治、正宗白鳥、野村胡堂、尾崎士郎、三好達治、佐藤春夫、中勘助、梅崎春生、江戸川乱歩、谷崎潤一郎、高見順、米川正夫、山中峯太郎、小宮豊隆、鈴木大拙、亀井勝一郎、山本周五郎、壺井栄、時枝誠記、笠信太郎、子母沢寛、広津和郎、村岡花子、木々高太郎、長谷川如是閑、伊藤整、獅子文六、西條八十、大宅壮一、三島由紀夫、深田久弥、内田百間、高橋和巳、志賀直哉、平林たい子、広瀬正、川端康成、椎名麟三、大佛次郎、サトウハチロー、浜田広介、花田清輝、江口渙、梶山季之、金子光晴、きだみのる、林房雄、香山滋、檀一雄、舟橋聖一、福島正実、武者小路実篤、武田泰淳、竹内好、今東光、稲垣足穂、海音寺潮五郎、野尻抱影、平野謙、柴田錬三郎、山岡荘八、花森安治、福永武彦、中野重治、植草甚一らを、青空文庫は一人として迎えられなくなる。
アメリカ同様の、パブリック・ドメイン・デイの喪失状態が、20年間にわたって続く。

EUのように、延長された保護期間が過去にさかのぼって適用されれば、青空文庫は、本日公開している作品の約半分を失う。
太宰治も坂口安吾も、中島敦、島崎藤村、菊池寛、新美南吉、海野十三、堀辰雄、横光利一、折口信夫、林芙美子、中里介山、北原白秋、斎藤茂吉、織田作之助、原民喜、与謝野晶子、宮本百合子、三木清らも読めなくなる。

これまで、その大半が紙の書籍に蓄積されてきた人の考えや思いを、電子化してインターネットに移し、検索と参照の網をかぶせようとする電子図書館の開発が、世界各国でさかんに進められている。
インターネットの普及以前に延長を決めたEU、その可能性を十分に繰り込まずに追随したアメリカは、自由に公開できる作品を限定してしまったしばりに、今、直面させられている。
Googleは、著作権の保護期間を過ぎた作品にとどまらず、権利が生きているものも電子化してサーバー上に置き、検索と部分的な参照のサービスを始めた。
これを著作権侵害であるとして、米国作家協会らは訴えたが、2008年10月、対価の支払いなどを条件に、電子化と利用を認める和解案に達した。それによれば、著作権者は拒否の意思を明示しない限り、和解に合意したとみなされる。さらにアメリカ国内にとどまらず、ベルヌ条約に加盟しているすべての国に、和解の効力が及ぶとも主張された。
電子図書館の実現という世界史的な課題に、Googleが先頭を切って取り組んできたことは間違いない。だが、力ずくで著作権法の縛りを乗り越え、しかもそれを全世界に拡張しようとする手法は、いかにも強引だ。
その強引さの裏には、保護期間の延長によって自由に電子化し、公開できる作品を大幅に限定してしまったくびきがみえる。
インターネット時代の趨勢を見誤って隘路にはまり込んだEUとアメリカを、「欧米並み」をうたって、今になって後追いすることには意味がない。
電子図書館の開発に最適のポジションを確保しているとの自覚をもって、パブリック・ドメインの書架をより豊かなものとするよう力をふるい、その成果を広く享受することこそ、私たちがなすべきことだ。

パブリック・ドメイン・デイのにぎわいにと準備してきたものを、最後に紹介したい。
テキスト版で用いる各種の青空文庫記号をまとめた、「注記一覧」だ。

青空文庫で取り組む作品には、さまざまな組み版の技法が用いられている。
これまで体験しないものにぶつかると、新しい注記を工夫し、しばらく揉んでみて、安定したものをルールとして定着させていった。
ところが、いきあたりばったりの積み重ねで進めてきたことに加え、書記役の怠慢もあって、注記に関する文書が分散した。決めたはずのものが、どこにも記載されていないという事態も招いた。
その積み残しの課題に、パブリック・ドメイン・デイを目標に取り組んだ。

とりまとめの目的の第一は、青空文庫の作業に資することだ。
加えて、さまざまに開発される青空文庫リーダーに、仕様のよりどころを示したいとも考えた。
そこで、既存の「テキスト版の注記をどう書くか」と「注記追加案」をもとに、青空文庫メーリングリストでの確認や、開発者などからの要望も踏まえて、「注記一覧(案)」をまとめた。

この作業と並行して、テキスト版をXHTMLに変換するためのスクリプトの作り直しにも、取り組んだ。

青空文庫のファイル作成作業を劇的に改善してくれた変換スクリプトだったが、使用したPerlという言語の制約があり、使っていく過程で判明した問題点を修正したり、新たな課題をこなす体制がつくれないという問題が重なった。
結果、だましだましの工夫や、手作業によるファイルの直し、知識が足りない者による不適切なプログラムの修正などをほどこしながらの運用を強いられたきた。
いずれ紹介できると思うが、そこに、スクリプトの作り直しに手をあげてくれる人が、現れた。

そこで、「注記一覧」のまとめに際して、注記側の検討と、スクリプトの開発を、互いをすりあわせながら同時並行で進め、XHTML化の道筋を、堅牢でより適切なものにしようと目論んだ。

変換スクリプトは誰でも動かせる状態でウェッブ上におくとともに、中身が見られて、再利用できる形で公開し、青空文庫リーダーの開発や、いわゆる青空文庫形式の電子出版への利用に風を送りたいとも考えている。

「注記一覧」には、主に青空文庫リーダーの開発者に向けて、新しいスクリプトで作ったソースを組み入れてある。
加えて、ここまでに、点検グループ、開発者から、これも追加してはと提案があった要素を、「追加検討要素」にメモした。
注記とタグの変更点は、「テキスト版注記とXHTML版の変更点」にリストアップしてある。

皆さんにスクリプトを動かしていただける環境も、今日までに用意したかったが、間に合わなかった。
準備でき次第、URLをお知らせする。

「注記一覧」で疑問に思う点、追加や変更が望ましい要素などあれば、reception@aozora.gr.jpに連絡してほしい。
ご意見を聞いて、2月中旬をめどに、仕様を確定したいと考えている。
そこから、プログラムを対応させてもらう時間をみて、4月1日公開分のテキスト版から「注記一覧」にそい、新しいスクリプトを用いたXHTML版に移行したい。
なお、切り替え時点で、収録ファイル全体を一気に差し替えることはできない。従来形式と新形式が、テキスト版、XHTML版の双方で共存することになる。

青空文庫のファイルに加えて、注記体系や変換スクリプトが、共有資源として活用されればありがたい。

パブリック・ドメイン・デイに向けて、今年は新規著作権切れ作家の作品と、「注記一覧」、特別仕様のトップページ以外は、なにも準備できなかった。
「祝おう!」と声を張って呼びかければ、来年からは、さまざまな企画が生まれるのではないかと期待している。
新しいこの年を元年として、日本にパブリック・ドメイン・デイが根付きますように。

2010年1月1日、明けましておめでとう。
ハッピー・パブリック・ドメイン・デイ!(倫)

トップページへ