Tim Berners-Lee氏は物理学者...?
2017年11月24日に代々木にてBPStudy #123「技術書籍執筆の実際、ノウハウ」が行われた。
内容に関しては清水川さんのエントリがよくまとまっているのでリンクを張る。
今回、公募LT枠が存在したので、査読や校正に関するテーマで発表することにした。 タイトルは「技術書査読・校正の現場から」とした。 最初は何に気を付けて読んでいるのかを発表しようとしたが、LTなので実際に遭遇した例を一緒に考えてもらう形式を採用した。
それで我々はどのへんを見ればよくなるのだろう。再現性... #bpstudy
— かしゅー (@kashew_nuts) November 24, 2017
結局、何に気を付ければよいのか、という結論が落ちていた。 そこで、このエントリで出題した例に従って整理してみる。
シンタックスに関する着目点
固有名詞・人名は確実に
例えばプログラミング言語を説明する場合はPythonと書く。
また、インタプリタを起動するコマンドは大抵pythonであろう。
JavaScriptとJとSを大文字にするのが正しい表記であるが、文脈に応じてECMAScriptと書くべきかもしれない。
Pythonの作者名Guido van Rossumのvanは小文字であり、van Rossumが苗字に当たる。
国文法は正確に
古典文法をまともに理解していない人間が偉そうに国文法を語るなど全く持ってい酷い話である。 まずは弖爾乎波をしっかり書く。卒論や修士論文で徹底的に指摘されるはずなので自分でも直せるはずである。 接続詞の関係。順接か逆接かを意識するだけでも効果があると思われる。
固有名詞、人名、単語、文法は言わばシンタックス(構文)に関する事柄である。 シンタックスに関するエラーは機械的にチェック可能であることが多い(と思う)。 例えば、綴りの間違いは(造語を持ち出していなければ)機械的に判定できる。 本当に難しいのはセマンティック(意味)に関するエラーである。
セマンティックに関する着目点
言語仕様を把握する
「Pythonには3つの数値型がある。」という文章があった場合、まずPythonのバージョンによって真偽が分かれる。
Python 2の場合はint, long, float, complex の4つ、Python 3の場合はint, float, complex の3つである。
さらに、標準モジュールをインポートすればDecimal型やFraction型も利用可能である。
裏を取る
「物理学者であるTim Berners-Leeは…」という記述があった場合、すぐに「物理学者という記述は誤りであり、計算機科学者が正しい」と直すになどうしたらよいのか。 僕は「裏を取る」という行動がよいのでは、と考えている。 ここで「裏」とは論理学の裏ではなく、別の方法で正しさを示すことである。 1点を通る直線は無数に存在するが、互いに異なる2点を通る直線は一意に決まるように、裏を取るようにすれば正しい記述なのかがわかる。
最初に「物理学者であるTim Berners-Leeは…」を読んだとき、Webで有名なTim Berners-Leeは物理出身なのか、と思いまずWikipediaを調べた。 そしたら計算機科学者とある。Wikipediaはとっかかりには最適であるが信頼性は落ちるので公式の情報源であるW3Cを調べて、 CERNにはconsultant software engineerとして仕事をしていたことを確認した。 その後のキャリアは計算機科学者そのものである。 確かに、オックスフォード大学のクイーンズ・カレッジの物理学科を卒業してCERNへ行って…となると「物理学者であるTim Berners-Leeは…」という記述は自然であるが、裏を取ることでわかるのである。
Typoを見つけるのが大好きなワタクシ
今の職場でも前の職場でも、Typoを発見するのが非常に早いと言われる。 先天性のものであろうか?運動神経はひどく悪いのでこの説は捨てたい。 僕が理由として挙げているのは、学部・院生時代に数学書を丹念に読んだからでは、と考えている。 学部・院生で読んだのは佐武一郎『線型代数学』とvan der Waerden『Algebra』の2冊であるが、名著と呼ばれるこの2つも意外と細かい誤植が存在するのである。 いい加減な理解ではセミナーは進まないので、1行ずつ読み進めていくのである。 この経験が査読や校正に生きているのでは、と考えている。
文章のシンタックスな間違いは機械的に処理できたとしても、文章のセマンティックを理解するために、査読は1行1行読み進めていくほかないのである。