數據清理
數據準備通常是任何電子表格任務中最耗時的部分。Excelmatic 的 AI 助手通過允許您使用自然語言命令清理數據集來簡化此過程,取代了手動篩選和複雜公式編寫。
為何使用 AI 進行數據清理?
傳統的 Excel 工具需要瀏覽多個選單。使用 Excelmatic,您只需描述期望的結果即可:
- 修復不一致性:標準化混合的日期格式或文本大小寫。
- 去除干擾:立即移除重複項或不相關的空白行。
- 處理缺失數據:使用智能邏輯根據列平均值或特定規則填充空儲存格。
常見清理工作流程
1. 移除重複項和空白行
問題: 您的數據集包含同一交易的多個條目或干擾分析的空白行。
命令:
基於“訂單 ID”列移除所有重複行,並刪除任何完全空白的行。

2. 標準化格式
問題:
日期以不同樣式記錄(例如 2023.01.01 和 1/1/23)或電話號碼有不一致的分隔符。
命令:
將“日期”列標準化為 MM/DD/YYYY 格式,並確保“客戶”列中的所有文本均為大寫。

3. 填充缺失值
問題:
關鍵列(如“價格”或“狀態”)中存在空儲存格。
命令:
使用該類別的平均值填充“價格”列中的缺失值,並將空的“狀態”儲存格標記為“不適用”。

命令參考表
| 目標 | 推薦命令 |
|---|---|
| 去重 | “基於[列名]移除重複項” |
| 數據修復 | “使用[值/平均值]填充缺失值” |
| 格式化 | “將[列]轉換為[貨幣/日期]” |
| 清理 | “移除所有儲存格中的多餘空格” |
練習實驗室
使用我們的示例數據集自行測試這些清理命令: 📂 下載 Messy_Sales_Data.xlsx
下一步:現在您的數據已經清理完畢,請在數據轉換中了解如何合併、拆分和重塑您的檔案。