數據清理

數據準備通常是任何電子表格任務中最耗時的部分。Excelmatic 的 AI 助手通過允許您使用自然語言命令清理數據集來簡化此過程,取代了手動篩選和複雜公式編寫。

為何使用 AI 進行數據清理?

傳統的 Excel 工具需要瀏覽多個選單。使用 Excelmatic,您只需描述期望的結果即可:

  • 修復不一致性:標準化混合的日期格式或文本大小寫。
  • 去除干擾:立即移除重複項或不相關的空白行。
  • 處理缺失數據:使用智能邏輯根據列平均值或特定規則填充空儲存格。

常見清理工作流程

1. 移除重複項和空白行

問題: 您的數據集包含同一交易的多個條目或干擾分析的空白行。

命令

基於“訂單 ID”列移除所有重複行,並刪除任何完全空白的行。

1

2. 標準化格式

問題:

日期以不同樣式記錄(例如 2023.01.01 和 1/1/23)或電話號碼有不一致的分隔符。

命令:

將“日期”列標準化為 MM/DD/YYYY 格式,並確保“客戶”列中的所有文本均為大寫。

2

3. 填充缺失值

問題:

關鍵列(如“價格”或“狀態”)中存在空儲存格。

命令:

使用該類別的平均值填充“價格”列中的缺失值,並將空的“狀態”儲存格標記為“不適用”。

3

命令參考表

目標 推薦命令
去重 “基於[列名]移除重複項”
數據修復 “使用[值/平均值]填充缺失值”
格式化 “將[列]轉換為[貨幣/日期]”
清理 “移除所有儲存格中的多餘空格”

練習實驗室

使用我們的示例數據集自行測試這些清理命令: 📂 下載 Messy_Sales_Data.xlsx

下一步:現在您的數據已經清理完畢,請在數據轉換中了解如何合併、拆分和重塑您的檔案。