データ分析
Excelを用いたデータクレンジング
データ分析の工数の80%はデータクレンジング
自己流
・範囲をテーブル定義する
・ソースは極力残し、加工後の値は別の列に追加する。
・置換ルールは、vlookupを用いる
・ルールからの逸脱は#N/Aで確認できる。
体系的な学習で追加した作法
・遠し番号の列を追加しておく。元の順番に戻すことができる。
・欠損値の確認:ステータスバーでデータの個数と数値の個数の差異を確認することで、数値の欠損を確認できる。
・異常値の確認:ステータスバーで最大値と最小値を確認することで、異常値を発見できる。