Windows system >> Windowsの知識 > >> Linuxシステムチュートリアル >> Linuxについて >> Linuxファイルの重複データ行をすばやく削除する方法

Linuxファイルの重複データ行をすばやく削除する方法

Linuxシステムの運用において、ファイル内のデータが多すぎる場合は、重複データ行を削除するのが非常に面倒です。データ行が重複していますか？次の小さなシリーズでは、重複するデータ行を削除する方法を紹介します。見てみましょう。

A、重複データを削除し、隣接する行

のコードは次のとおりです。

$猫data1.txt | Uniq

出力：

beijing

wuhan

beijing

wuhan

次に、重複しているデータをすべて削除します。行

コードは次のとおりです。

$ cat data1.txt | 並べ替え| Uniq

注：

隣接する重複データ行を削除するには、uniqコマンドのみが使用されます。

最初にソートすると、すべての重複データ行が隣接するデータ行に変換され、uniqの場合、すべての重複データ行が削除されます。

出力：

北京

武漢

添付：data1.txt

コードは以下のとおりです。

[root] @syy〜]＃cat data1.txt

北京

北京

武漢

武漢

武漢

北京

北京

北京

wuhan

wuhan

注：フィルタログのIPアドレスは便利です。

Linuxでビッグデータファイル内の重複したフィールドを1行削除する

最近作成されたデータ収集プログラムでは、1000万行を超えるデータを含むファイルが生成されました。要件に応じて、2番目のフィールドの重複行を削除する必要があり、それを見つけたときに正しいツールが見つからない場合sed /gawkなどのストリーム処理ツールでは1行ずつ処理され、繰り返しフィールドのある行は見つかりません。私はプログラムをpythonで実行しなければならないようで、突然mysqlを使用することを考えたので、私は大きく動いた：

1. mysqlimport --local dbname data.txtを使用してデータをテーブルにインポートする。一貫性のある

2.次のsql文を実行します（一意のフィールドがuniqfieldである必要があります）。

コードは次のとおりです。

use dbname;

alter table tablename add rowid int auto_incrementがNULLではありません;

テーブルを作成t uniqfieldで、テーブル名グループから行IDとしてmin（rowid）を選択します。 .rowid; "/p" "p"テーブルtablenameの削除;

テーブルt2の名前をtablenameに変更;

上記はLinuxで重複データ行を削除する方法です。この記事ではさまざまな方法を紹介しますファイルの重複したデータ行を削除する場合、私はあなたを助けたいと思います。

Linuxについて

Windowsの知識

Linuxインストールg77コンパイラスキル

Ubuntu10.10システムでは、g77は完全にgfortranに置き換えられましたが、過去のg77とは完全には互換性がないため、977でコンパイルされたプログラムは使用できません。だから私たちは自

Linuxでtouchコマンドを使うにはどうすればいいですか？

Linuxコマンドでは、cd、ls、その他のコマンドを使用することがよくありますが、touchのようなコマンドはあまり役に立ちません。それでtouchコマンドは何をす

Linuxで2台目のハードディスクを検出してマウントするステップ

Linuxで2台目のハードディスクをマウントする場合は、ハードディスクを認識できるかどうかを確認してからマウントする必要があります。 Linuxは、興味のある友人が理解したいと思うかもしれない2番目の

Red Flag Linuxデスクトップ5 SAPGUIクライアントの使用方法

Red Flag Linuxユーザの中には、システムを4.1から5にアップグレードし、SAPGUIのインストール後に4.1システムのようにスムーズにSAPGUIクライアントを使用できないことを発見した

Linuxで環境変数を設定する場合のファイル

の変更方法 Linuxシステムでは、環境変数をシステムレベルとユーザーレベルに分けて変更する必要があるため、ファイルの変更方法が異なります。 Linux環境変数を変更する方法の詳細な紹介をします。ユー

Linuxカーネルでモジュールを管理する方法

Linuxカーネルはいくつかのモジュールに分割されています。管理に便利で、新しいモジュールを簡単に追加してLinuxシステムの機能を強化することができます。以下は、カ

LinuxシステムFAQ

Linuxチュートリアル

Linuxについて

Windows の記事

Linuxはどのようにglibcによって引き起こされるカーネルパニック問題を修正するには？

Linuxシステム用の履歴出力フォーマットをカスタマイズする方法

LinuxシステムはHistoryコマンドを使用してシステムのログレコードを表示し、問題を特定します。ただし、Historyからのデータ出力には、時間やその他の情報が含まれていないことがよくあります。この記事ではLinuxシステム用に履歴出力フォーマットをカスタマイズする方法をお教えします。

具体的な方法

rootユーザーの/etc/profile.d/

Linuxシステムのtopコマンドの使い方

CentOS 5.5ではシングルユーザーモードが禁止されています

Linuxシステム用のシンボリックリンクを作成する方法

Linuxシステム用のqcow2とrawイメージフォーマットの選び方

Linux Zshコマンドの使用例

Linuxシステムでよく使われるのはbashシェルなので、多くのユーザーはZshに慣れていないので、次の小シリーズではZshコマンドの例をいくつか紹介しますので、Zshをより深く理解することができます。

1：使用ワイルドカード*下位ディレクトリとして:.

$のls ** /* PYC

fooという。 Pyc bar.pyc lib /wibb

Linux文字セットの変更方法

Linux Clam Antivirusの使い方Antivirus

LinuxシステムでのApacheとTomcatの違い

Ubuntu 12.04でXenをインストールするFAQと解決策

Windows ナレッジ

Windows 7のセキュリティを向上させる：Microsoftは5つのことを行うべきである

win7 Ultimateコンピュータの自動起動を設定する方法

カードの温度を処理する方法が高すぎます

マイクロソフトは、Windows 7

完全なWindowsシステム仕上げ5つのステップを経験する

WP8.1 /Win10ストアアプリケーションの広告、これは大きなもののリズムですか？

ファイルやフォルダを使用する方法Win8 /WinRTの

Windows XPは、プロジェクトを開始する順序を指定します

多くの友人がVista、またはWin7システムを使用している前にセーフモード

Windows システム

Windows XPシステムチュートリアル

Windows 7システムチュートリアル

Windows 8システムチュートリアル

Windows 10システムチュートリアル

Windows 2003システムチュートリアル

Windows 2008システムチュートリアル

Windows Vistaシステムチュートリアル

Windowsチュートリアル合成

Windows Serverシステムのチュートリアル

Linuxシステムチュートリアル

コンピュータソフトウェアのチュートリアル

Windows NTチュートリアル

Copyright © Windowsの知識 All Rights Reserved