Windows system >> Windowsの知識 >  >> Linuxシステムチュートリアル >> Linuxチュートリアル >> Linuxのテキスト処理コマンド(sortとuniq)

Linuxのテキスト処理コマンド(sortとuniq)

  
 

並べ替えコマンド

並べ替えコマンドの機能は、ファイル内の行を並べ替えることです。 sortコマンドには、元々データベースのフォーマットでファイルの内容をソートするのに使われていた非常に便利なオプションがいくつかあります。実際、sortコマンドはデータベースレコードに似た内容のファイルを管理するための非常に強力なデータ管理ツールと考えることができます。


Sortコマンドは、ファイルの内容を1行ずつソートし、2行の最初の文字が同じであれば、2行の次の文字を比較します。比較は続行されます。


構文:


sort [options] file


説明:sortコマンドはファイルを指定します行内のすべての行がソートされ、結果が標準出力に表示されます。入力ファイルを指定しない場合、または' - 'を使用した場合、並べ替えの内容は標準入力から取得されます。


並べ替えは、入力行から抽出された1つ以上のキーワードを比較することによって行われます。ソートキーは、ソートに使用する最小の文字シーケンスを定義します。デフォルトでは、behaviorキーワード全体がASCII文字順にソートされています。


デフォルト設定を変更するためのオプションは次のとおりです。


- m指定したファイルがソートされている場合は、ファイルをマージします。


- c指定されたファイルがソートされていることを確認し、順序が正しくない場合はエラーメッセージを表示してステータス値1で終了します。


- u並べ替え後、同じと見なされる行は1つだけ残します。


- o出力ファイルが標準出力ではなく出力ファイルにソートされた出力を書き込む出力ファイルが入力ファイルの1つである場合、sortはまずファイルの内容を一時ファイルに書き込みます。その後、出力をソートして書き込みます。


デフォルトの照合順序を変更するためのオプションは次のとおりです。


- d辞書順で並べ替え、文字、数字、スペース、タブは意味があります。


- f小文字を大文字で扱います。


- 印刷されない文字は無視します。


- 月比較としてM:<; JAN'<' FEB'

- rソート結果を逆の順序で出力します。


+ posl - pos2ソートキーとして1つまたは複数のフィールドを指定しますフィールド位置はposlから始まりpos2で終わります(pos2を除くposlを含みます)。 pos2が指定されていない場合、キーワードはposlから行末までです。フィールドと文字の位置は0から始まります。


- b各行でsortキーワードを探すとき、先頭の空白(スペースとタブ)を無視します。


- t separatorフィールドの区切り文字として文字の区切り文字を指定します。


これがsortの使い方を説明するための例です。


テキストファイル内の行を並べ替えて結果を出力するには、sortコマンドを使用します。元のファイルの2行目と3行目の最初の単語は同一であり、コマンドは2番目の単語 "vegetables"と果物の最初の文字を比較し続けます。


$ cat text


野菜スープ


新鮮な野菜

< Br>

新鮮な果物


低脂肪牛乳



$並べ替えテキスト


新鮮な果物


新鮮な野菜


低脂肪牛乳


野菜のスープ


ユーザーはソートしたファイルの内容を保存したり、ソートしたファイルの内容をプリンターに出力することができます。次の例では、ユーザーはソートされたファイルの内容をresultという名前のファイルに保存します。


$ sort text> result


2番目のフィールドをソートキーとして、ファイル例の内容をソートします。


$ sort + 1-2の例


file1ファイルとfile2ファイルの内容を逆に並べ替えると、2番目のファイルを使用して結果がoutfileに配置されます。フィールドの最初の文字がソートキーとして使用されます。


$ sort -r -o outfile +1.0 -1.1 example


並べ替えソートは、パイプラインの他のコマンドと組み合わせてよく使用されます。現在の作業ディレクトリ内のファイルをソートするためにパイプラインを使用するなどのより複雑な機能では、ソートキーは6番目から8番目のフィールドです。


$ ls - l

Copyright © Windowsの知識 All Rights Reserved