データクリーニング

データの準備は、多くの場合、スプレッドシート作業の中で最も時間のかかる部分です。ExcelmaticのAIアシスタントは、自然言語コマンドを使用してデータセットをクリーンアップできるようにすることでこれを簡素化し、手動フィルタリングと複雑な数式作成に取って代わります。

データクリーニングにAIを使用する理由は?

従来のExcelツールでは、複数のメニューをナビゲートする必要があります。Excelmaticでは、目的の結果を記述するだけです:

  • 不整合を修正: 混在した日付形式やテキストの大文字小文字を標準化します。
  • ノイズを除去: 重複や無関係な空白行を即座に取り除きます。
  • 欠損データを処理: 列の平均値や特定のルールに基づいて空のセルを埋めるスマートロジックを使用します。

一般的なクリーニングワークフロー

1. 重複と空白行の削除

問題: データセットに同じ取引の複数のエントリや、分析を妨げる空白行が含まれています。

コマンド:

'注文ID'列に基づいてすべての重複行を削除し、完全に空白の行を削除してください。

1

2. フォーマットの標準化

問題:

日付がさまざまなスタイル(例:2023.01.01と1/1/23)で記録されているか、電話番号の区切り文字が一貫していません。

コマンド:

'日付'列をMM/DD/YYYY形式に標準化し、'顧客'列のすべてのテキストが大文字になるようにしてください。

2

3. 欠損値の補充

問題:

'価格'や'ステータス'などの重要な列に空のセルがあります。

The Command:

'価格'列の欠損値をそのカテゴリーの平均値で埋め、空の'ステータス'セルを'N/A'としてマークしてください。

3

コマンドリファレンス表

目的 推奨コマンド
重複排除 "[列名]に基づいて重複を削除"
データ修復 "[値/平均値]で欠損値を埋める"
フォーマット "[列]を[通貨/日付]に変換"
トリミング "すべてのセルから余分なスペースを削除"

練習ラボ

サンプルデータセットを使用して、これらのクリーニングコマンドを自分でテストしてください: 📂 Messy_Sales_Data.xlsxをダウンロード

次のステップ:データがクリーンになったら、データ変換でファイルをマージ、分割、再構成する方法を学びましょう。