Rational C Coding Convention

0. Informing

0-1	日本語エンコーディングはEUC	3
0-2	改行はLFのみ	4
0-3	最終行の改行コードを忘れないようにする	5
0-4	ファイル名に大文字を使わない	6
0-5	13区文字などを使わない	6
0-6	英数字/記号はASCIIで書く	6

1. Notation

1-1	インデントにはタブを使う	7
1-2	中括弧の位置	8
1-3	条件部の前の空白	9
1-4	関数の括弧の前に空白をあけない	10
1-5	2項演算子の両側には1つずつ空白をあける	11
1-6	sizeofは関数のように書く	12
1-7	caseラベルのインデント	13
1-8	ラベルのインデント	14
1-9	括弧のすぐ内側に空白をあけない	15
1-10	カンマの前には空白をあけない、後ろにはあける	16
1-11	カンマは前の行の末尾に付ける	17
1-12	セミコロンの前に空白をあけない	18
1-13	forのセミコロンの後ろには空白をあける	19
1-14	ブロックコメント	20
1-15	インラインコメント	21
1-16	#includeの後ろには空白をあける	22
1-17	ラベルのコロンの前は空けない	23
1-18	余分な括弧は付けない	24
1-19	16進数は小文字で	25

2. Rhetoric

2-1	(void *)やconstにキャストしない	25
2-2	NULLをキャストしない	26
2-3	'\0'のことをNULLと呼ばない	27
2-4	'\0'やNULLを0で代用しない	28
2-5	void型関数のreturn	29
2-6	typedefで余分なタグを書かない	30
2-7	ポインターや配列をtypedefしない	31
2-8	同名のローカル変数で他の変数を隠さない	32

3. Syntax

3-1	struct中で名前なしunionメンバーを使わない	33
3-2	文字リテラル中に2バイト以上書かない	34
3-3	#ifdefを使わない	35

4. Logic

4-1

エンディアン依存のコードを書かない

	従来のルールでも規定されているのに守られていないことが多いので強調したいもの
	従来のルールの解釈によっては相反するもの
	従来のルールで明確に規定されていることと相反するもの

0-1 日本語エンコーディングはEUC

ソースファイルの日本語エンコーディングはEUC-JPにする。日本語エンコーディングとしてCのソースファイルに使われるものは他に、

Windows上のVisual C++ 6.0などでは、日本語のソースファイルはEUC-JPのものでも、コンパイラーそのものは処理するが、 IDE環境ではShift_JIS以外は文字化けしてしまうし、文字列リテラルはShift_JISで記述しないと実行時に正しく表示されない。そのような環境ではShift_JISを使うのもやむをえないが、 Unix環境においてShift_JISを使う利点は1つもない。

たいがいのプロジェクトでは日本語文字に対応していない処理系との互換性を考え、『文字列リテラルや文字リテラル中に日本語文字を直接書かない』ことになっているので問題ないのだが、もしリテラル中に日本語文字を書く場合、エンコーディングをShift_JISにするといろいろな問題点がある。

文字列リテラルの中にShift_JISの文字を書くことができる処理系であっても、単に『素通し』にしているだけの対応しかしていないものは、以下のように『2バイトめが0x5c(バックスラッシュ)である文字』を文字列リテラル中に書いたときに、正常に処理されない。

そのような文字の直後には以下のようにバックスラッシュを追加してエスケイプする必要がある。

このようにエスケイプしたとしても、そのShiftJIS文字列を適切に処理する (バックスラッシュによるエスケイプを追加しなくてもよい)処理系にそのソースを持っていくことを考えて、#if～#else～#endifで両方のパターンを書く、などかなり面倒なことが必要になる。

また、現状のプロジェクトのように、コメント中にのみ日本語を使うのならば平気かというとそうでもなく、たとえば『//』形式のコメントが許可されている場合、そのコメント末尾に『2バイトめがバックスラッシュな文字』があると、次の行が継続されてしまい、正常に処理されない。(場合によってはコンパイルエラーにさえならなことも多く、気づかないと危険である!)

(註: 現在なら『UTF-8で統一』という選択肢もあるだろうが、どっちにしろShift_JISを選択する理由だけは1つもない。百害あって一理無し。)

[参考] Shift_JISで2バイトめがバックスラッシュ(0x5c)になる文字の一覧

0-2 改行はLFのみ

テキストファイルの改行コードの種類には主に以下の3通りがある。

UnixとWindowsでファイル共有する場合も、 Windowsのテキストエディターはこの3種類のどれにでも設定可能なので、問題ない。

逆に、UnixでWindowsの『CR+LF』方式のファイルを編集すると、 1つの『CR』が文字として認識されてしまう。(以下の『^M』の部分がそう)

0-3 最終行の改行コードを忘れないようにする

Windows上のテキストエディターなどで編集していると、以下のように、一番最後の行に改行コードを付け忘れることがある。

これは実は正しいテキストファイルではない。 Windowsなどでは、融通を利かせてこのようなファイルも扱うものが多いが、 Unix上のツールではテキストファイルというものを厳密に扱うものも多いので、以下のように、テキストファイルとして正しく、最終行にも改行コードを忘れず付ける。

0-4 ファイル名に大文字を使わない

Windowsではファイル名の大文字/小文字は区別されない(保存はされる)環境だったので、大文字/小文字の使い分けがいい加減なソースファイルも多かったが、 Unixではファイル名の大文字/小文字は区別されるので、大文字を使わないように統一する。

小文字(a～z)の26種類と数字(0～9)および下線(_)のみの組み合わせに、「.c」をつけたものとする。また、先頭の1文字には数字や下線は使わず、必ずa～zのうちどれかで始めること。

Windows環境のCコンパイラーでは、ソース中のインクルードファイルの記述で、

などと書いてあっても、『foo.h』という小文字のファイルをインクルードしてくれたが、Unixでは当然これは『No such file.』というコンパイルエラーになる。

0-5 13区文字などを使わない

丸付き数字、ローマ数字等、JIS X 0208の13区をローカルに利用しているコードは、文字列中はもちろんのころ、コメントの中にも使わない。

それらのコードは、JIS X 0208の規定の中になく、Windowsなどで独自に割り当てているものなので、他の環境でそのソースを見たときに文字化けしてしまったり、別の文字に見えたりするので、バグの元となる。

また、Linux上のsedなどは内部がUTF-8で処理しているため、13区文字が混じっていると異常動作したり、終了したりする。

従来ソースでは、携帯電話での『絵文字』のコードがそのままコメント中に書かれているものさえあった。もちろんそれも使わない。

0-6 英数字/記号はASCIIで書く

コメント中に、いわゆる『全角数字』や『全角英字』を混ぜないこと。

上記のように混じっていると、同じものをエディター上で検索しながら見るときに不便なので、以下のように使う文字を統一しておけばよい。

記号についても、ASCIIにある32個の記号は、JIS X 0208のもの(いわゆる全角記号)ではなく、ASCIIのほうを使う。

1-1 インデントにはタブを使う

インデントにはその深さに応じた個数のタブコード(0x09)を使う。空白(0x20)は使わない。

標準ではタブ1個が空白8個分になる端末が多いが、これはテキストエディターの設定などで変更できるので、4個分程度に設定しておけばよい。

Unix上のviならば、ホームディレクトリーの『.exrc』中(vimなら『.vimrc』)に以下の設定をしておけば、タブ1つが空白4つ分で表示される。

1-2 中括弧の位置

のように書く。 (開くほうも閉じるほうも独立した1行に書き、インデントせずどちらも1桁めに書く)。

のようにカーネルスタイル(K&Rスタイル)で書く。 (開きカッコを前の行の末尾に(空白を1つあけて)書く)。

1-3 条件部の前の空白

if、while、for、switchなどの『判定条件』の部分を持つ制御のキーワードは

のようにキーワードに続く開き括弧との間に1つだけ空白を空けて書く。

1-4 関数の括弧の前に空白をあけない

1-5 2項演算子の両側には1つずつ空白をあける

可読性のため、2項演算子の両側には空白をあける。つまり、

これら「->」と「.」は2項演算子でありながら、両側のどちらにも空白をあけずに詰めて書く。

3項演算子も2項演算子と同様、それぞれの両側に空白を1つずつあけて書く。

逆に、単項演算子の場合は被演算数とのあいだに空白を「あけない」。

1-6 sizeofは関数のように書く

この括弧を省いたらエラーになるが、型名ではなく、変数などのオブジェクトに対して適用する場合は実は括弧が必要ないので、以下のように書いても文法的には正しい。

ただ、この場合にも括弧をつけて書く以下の書き方に統一する。

また、どちらの場合も、関数の場合と同じように開き括弧の前に空白をあけないこと。

1-7 caseラベルのインデント

switch文中のcaseラベルのインデントの深さはswitchの深さに合わせる (つまりswitchの内側だが、インデントレヴェルを増やさない)。以下のように書く。

1-8 ラベルのインデント

goto文を使う場面はめったにないので、飛び先のラベルを使う必要も同様に少ないが、使うときはインデント位置に注意する。

以下のように、そのラベルの存在する位置のインデントレヴェルより『1つインデントを減らして』書く。

もしくは以下のように、ラベルだけは『インデント量を0に』して書く。

1-9 括弧のすぐ内側に空白をあけない

1-10 カンマの前には空白をあけない、後ろにはあける

1-11 カンマは前の行の末尾に付ける

長い文を複数の行に分割する場合、以下のようには書かない。

次の行の先頭にカンマをつける癖は、以下のような根拠が原因だと思われる。

つまり、#ifなどで条件付きコンパイルする場合、カンマを前の要素の行末に付ける方法だと、最後の要素の場合にカンマを付けるかどうかのところが合理的にいかないというのである。しかし、逆に#if～#endifで括る要素が1番目の要素だったらどうだろう? と考えたときに、このやり方の矛盾に気づくであろう。

また、Cの文法ではC89の時代から、以下のように最後の要素の後ろにカンマが付いていても問題はないことになっている。

1-12 セミコロンの前に空白をあけない

1-13 forのセミコロンの後ろには空白をあける

1-14 ブロックコメント

コメントの始まりと終わりは独立した行に書き、 2桁めに「*」がくるようにそろえる。以下のように「枠を書く」ことは避ける。

1-15 インラインコメント

コードと同じ行に書くコメントは、同じ行にコメントの始まりと終わりを書く。通常のコメントの場合は、コメントの始まりの直後、コメント終わりの直前、にはそれぞれ1つの空白をあける。

ただし、通常のコメントではなく、Cの文法検査ツールに指示を与えるコメントは、コメント始まりの後ろ、コメント始まりの前に空白をあけずに書く。

1-16 #includeの後ろには空白をあける

かといって、1文字分ぐらい節約したところで何の利点もない。以下のように必ず空白をあけてファイル名を書くようにする。

1-17 ラベルのコロンの前は空けない

switchに使うラベルだけでなく、gotoの飛び先に使うラベル(めったに使う場面はないが)も同様に、コロンの前には空白を空けない。

1-18 余分な括弧は付けない

以下のような式では、演算子の結合の優先度通りなので括弧は必要ないが、

『念のため』もしくは『複雑な式なので見やすくして意図を明白するため』に以下のように括弧を付ける分には問題ない。

しかし、以下のような括弧は余分であり、かつ、見づらくなるだけなので、

1-19 16進数は小文字で

16進定数の数値を書くときのa～fは文法的には以下のように大文字で書いてもよい。

しかし、小文字で書いてある箇所と大文字で書いてある箇所が混在するのは見づらし、大文字で書く利点もないので、Cの慣例にならって小文字に統一する。

また、16進定数を示す『0x』のxは文法的には大文字でも書くことができる。

しかし、そうする利点もなく、見づらいだけなので、小文字のx統一する。

2-1 (void *)やconstにキャストしない

とプロトタイプ宣言されている関数に「char *」型のポインターを引数で渡すときに

とだけ書く。 (ただし、『ポインターのポインター型』に代入したり比較したりする場合には、キャストする。)

キャストを濫用するのはバグのもとなので、本当に必要な箇所でのみ行なうべきである。そのキャストが本当に意味があるものかどうかコードを注意深く読む際に、必要のないキャストがあちこちに出てくるのは目の邪魔である。 (本当に危ないキャスト(つまりバグの元!)を見逃す危険性を増やす)。

関数の引数に渡す場合だけでなく、「void *」型のポインターに代入する場合も同様である。

また、void *のポインターだけでなく、constに関しても同様である。 constな変数にそうでない変数を代入する場合や、constと宣言されている関数の引数にそうでない変数を渡す場合には、キャストをするべきではない。 (逆方向はエラーや警告が出るはずなので、キャストしないと通らないわけだが)

2-2 NULLをキャストしない

2-3 '\0'のことをNULLと呼ばない

CではNULLと大文字4文字で書くと、「null pointer」のことを言う文化がある。 NULLというマクロ名がそうだからだ。したがって、文字列終端の「null character」を意味するときに以下のようなコメントは不適切である。

もしくは、nulと「小文字」にしたり、3文字略語としたりし、あえて、大文字4文字のNULLは「null pointer」の意味にだけ使うようにし、誤解を避ける。

2-4 '\0'やNULLを0で代用しない

しかし、null pointerにはマクロ名「NULL」を使い、文字列終端のnull characterには'\0'を使い、意味を明確にすべきだ。

2-5 void型関数のreturn

void型の関数定義の末尾(閉じ中括弧の直前)には以下のようなreturnを書かない。

2-6 typedefで余分なタグを書かない

構造体の定義その構造体のtypedefを別々に行なうのではなく、構造体定義を直接typedefする場合、以下のようにタグ名も付けることができる。

その構造体の中にその構造体自身へのポインターをメンバーとして含む場合などには、タグ名も必要になるが、そのように『タグ名を使う用事』が明確にある場合以外は余分なタグを書かずに以下のように定義する。

『あとで使うかもしれない』ぐらいの根拠で意味もなく付けないこと。 (従来のソースで付けてあるものがよくあったので、そう書くものだと思い込んでいちいちつける人があとをたたなかったため)。

2-7 ポインターや配列をtypedefしない

Cの文法的には配列やポインターをtypedefしてしまうこともできる。従来のプロジェクトのコードでは以下のように、構造体をtypedefしたあと、その構造体へのポインターをもtypedefしてあるのをよくみうけられた。

このやり方では、その変数がポインターであるかどうかがわかりにくくなり、「*」をいくつつけるべきか、また、関数引数として渡すときに「&」を付けるべきかどうかが直観的にわかりにくく、さらにはポインターの初期化しわすれや、誤ったキャストなどのミスにつながりやすい。

この悪習はWindowsのWin32プログラミングなどの影響である可能性が高い。

型名の先頭の『P』を付けたからといってわかりやすくなるわけでもなく、以下のように素直にポインターには「*」をつけて宣言し、使用したほうが、明確でわかりやすいコードになる。

2-8 同名のローカル変数で他の変数を隠さない

プラットホームルールブックでは、なるべく内側のスコープでのローカル変数宣言を推奨しているが、同じ関数内に複数スコープが存在する場合、他スコープで宣言したものと同じ変数名を使用してはならない。

…もはや理解不能です。こういったコーディングは絶対に止めましょう。

また、ローカル変数のネーミングは「すべて小文字で」「極力短く」することで、マクロや外部変数と一目で差別化できますので、「すべて小文字で」「極力短く」してください。

3-1 struct中で名前なしunionメンバーを使わない

gccの拡張文法では、以下のような構造体が定義可能である。

これは、Cの標準規格では文法違反でエラーになる(C89だけでなくC99でも)。したがって、以下のようにメンバー名を付ける。

3-2 文字リテラル中に2バイト以上書かない

EUC-JPやShiftJISのマルチバイト文字を、文字リテラル(『"』ではなく『'』で括るもの)中に直接書くことができる処理系もある。互換性の見地からはそれ自体好ましい書き方ではないが、問題は、それが使えない処理系に移植した場合に、文字リテラルはそのまま使い中だけ『\x』のあとに16進数で書くような対処の仕方である。 Cの文法では、文字リテラル中に2バイト以上書いた場合のバイトスワップの有無は『処理系依存』ということになっている。したがって、同じリトルエンディアンのCPU用でも、以下のようにバイトスワップの有無を意識した#if～#else～#endifで区切られた 2通りの記述をわざわざ書かなければいけなくなる。

もともとこれは2バイトshortのコードを入れているだけなのだから、文字リテラル中にShiftJISの文字を直接埋め込むことができなくなった時点で文字リテラルの利点はなくなるのだから、わざわざ#ifを使ってまでそれにこだわる必要はない。以下のように文字リテラルを使わずに書けば、#if～#else～#endifも必要なくなる。

3-3 #ifdefを使わない

コンパイルスイッチで切り分けてコンパイルする/しない部分を指定するには、 #ifdefを使わず、#ifを使うべきである。

理由を説明すると長くなるが、たとえば『-DIM_FOO』というスイッチを指定するか省くかによって切り分けている場合、そのスイッチの名前の綴りを間違えて(『_』を忘れて)、

のようにしてしまった場合、名前『IMFOO』は定義されていないため、この部分はコンパイルされない。 (『-DIM_FOO』を附けても)

綴り間違いによって未定義となっている名前の値は『0』として扱われることがCの文法により定まっているため、やはり同様の問題は起きてしまう。

しかし、たいがいのCコンパイラーでは『未定義の名前を#ifで参照したら警告を出す』という機能があるため(gccでは-Wundefオプションを指定)、それを指定することにより、この問題を解決できるのだ。

ところが、この機能を使う場合、#ifdefを使って(かつ、未定義の名前は偽となることを期待して書いて)いる箇所があると、それらも一緒に警告され、邪魔になるため、 #ifdefおよび#ifndefは使用すべきではない、というわけだ。

defined()

通常のコンパイルスイッチ的に使う場合ではなく、以下のように『すでに定義されて』いるかどうかを調べたい場合は、

同様に#ifndefも使わない

同様の理由で#ifdefも使うべきではないが、それらの理由の他にも、『#ifdef FOO』と『#ifndef FOO』の視認性の悪さ (この2つはぱっと見て見間違えることが多い)からも、使うべきではないと言えるだろう。その点、『#if FOO』と『#if !FOO』ならば、見やすい。

4-1 エンディアン依存のコードを書かない

しかし、これはWORD(unsigned short)が、リトルエンディアンであることが前提のコードであり、ビッグエンディアンの環境では正しく作動しない。

通常のEUCやShiftJISの文字列中のように2バイトのコードが上位バイトが先に出てくるものを、コードの数値としてintやshortに格納するには、以下のようにすればよい。

この書き方のほうが、汎用性がある(intやshortがリトルエンディアンかビッグエンディアンかに依存しない)だけでなく、実は効率もよい。(以下参照)

『Rational C Coding Convention (draft)』$Revision: 1.11 $

contents