GNU Coreutils: 7.5.2 ptx が使用する文字セット

7.5.2 `ptx` が使用する文字セット

現在の設定では、ptx プログラムは、入力ファイルが符号化に 8-bit の ISO 8859-1 コード (Latin-1 文字セットとも言われる) を使用していると見なすようになっている。ただし、MS-DOS 用にコンパイルされている場合は別で、その場合は、IBM-PC の文字セットが使用される (GNU の ptx が MS-DOS マシンで使えるかどうか、今ではわからないけれど)。 7-bit ASCII と比べると、ISO 8859-1 の文字セットは、アルファベットの部分が異なっている。そのため、正規表現におけるマッチングの振る舞いが変わってくる。キーワードに対するデフォルトの正規表現が (訳注: つまり、GNU の拡張が有効なときの ‘\w+’ が)、英語で使用しない文字や、ウムラウトやアクセントのような発音区別符の付いた文字を受け入れることになるのである。とは言え、キーワードのソート方法は今だに大雑把であり、使用している文字セットの順序にきわめて盲目的に従っている。

‘-f’
‘--ignore-case’: ソートするとき、小文字を大文字と同じものとして扱う。

This document was generated on June 7, 2022 using texi2html 1.82.