S b953c14c80d01b0921279dedf6b9db80 データクレンジング

●自己流の方法
◎一般的な方法(出典:ディジタルグロースアカデミア)

準備

◎遠し番号をつける
●テーブルを構成する
●ゆらぎが生じている列のスライサを表示し、ゆらぎや欠損値、エラー値を見つける
◎分析対象の行を抽出する:「有効」列を追加し、分析対象行に1を入力

文字列の表記をゆれ

◎文字列の始めまたは終わりの空白を除去:=trim()
●商号を統一(株式会社、(株)、㈱など)
●姓名は分離する。

変換して統一する

◎ひらがな・漢字をカタカナに変換:=phonetic()
◎英字を大文字に統一する:=upper()
◎英字を小文字に統一する:=lower()
◎英数字を全角に統一する:=jis()
◎英数字を半角に統一する:=asc()

検索・置換

●iferror(vlookup(対象,置換テーブル,置換列),"N/A")

年月日の変形

●年、月、日を抽出する:=year(), =month(), =day()
●yyyy/mm/ddをyymmに変換する:=(year(対象)-2000)*100+month(対象)
●曜日を抽出する:=text(対象,"aaa")、または、=text(対象,"aaaa")

もしかして

    他の人の「データクレンジング」

    S b953c14c80d01b0921279dedf6b9db80

    Future Center/R&D/Knowledge Management/Wiki/EGMフォーラム/読書家/思想家/語り部/探検家/歴史/作家志望/ 時々仮説・持論を独白します。突っ込み歓迎。

    最新

      最新エントリ

        関連ツイート