テキスト

コンピュータの文脈では、テキストとは、装飾のない文字で表現されたデータである。
文字端末に直接出力しても人間が読めるものである。

現代において、この定義はあいまいになっている。
これは、多数の装飾文字を含む[[Unicode]]が存在するためである。

テキストも、コンピュータにとっては、[[データ]]の一種に過ぎない。
データの中で、ある特徴を持ったものがテキストである。

テキストには種類がある。
ひとつには、どの数値がどの文字に対応するかを決めた[[文字コード]]によって分類される。
通常使われる文字コードには、[[ASCII]][[UTF-8]]がある。
ASCIIは英語の文字しか含まれず、UTF-8は世界中の言語の文字が含まれる。
また、同じ文字コードで書かれていても、文書の形式が異なれば、異なるテキスト形式と捉える場合もある。
例えば、同じASCIIコードで書かれていても、文学作品の場合もあれば、プログラムの場合もあり、また数値データの場合もある。