モノ > ホビー・ホーム用品 > ホビー・カルチャー > 絵本・書籍 > 現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法

サンプルコードと解説が少し雑
pandasの入門レベルから実務操作までカバーしている

現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法

現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 1
  • 現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 1
¥4478 国内発送
購入期限 :
期限切れ(リクエスト)
数量 :
あと1個
状態
新品・未使用
ブランド
 
モデル
 
カテゴリ
ホビー・ホーム用品
ホビー・カルチャー
絵本・書籍
買付店舗
買付地
日本

商品の説明
機械学習エンジニア&データサイエンティスト必携!初学者でもpandasによる前処理手法がわかる!

機械学習やデータサイエンスでは、いかに「きれいなデータ」を用意できるかが非常に重要です。データクレンジングともいわれますが、実際の現場のデータは、機械学習やデータ分析にすぐ利用できるデータは皆無に等しく、エンジニアによりデータの前処理が必須となってきています。

【概要】
本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。
初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。
pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。

【対象読者】
機械学習エンジニア(初学者)
データサイエンティスト(初学者)

機械学習では「Garbage In, Garbage Out(略、GIGO)」と言う概念があります。これは「無意味な(ゴミのような)データを入力すると無意味な結果が戻される」の意味です。GIGOの概念でも解る通り、機械学習エンジニアは様々な手法で収集された膨大なデータの分析を行い、意味のある結果を得るために、多種多様な手法の前処理/分析を行います。

機械学習において約7割の時間はデータの前処理に費やされると言われていますが、その多くは「pandas」を使ったものです。
CSVファイルの読み込みから始まり、要約統計量や欠損値・外れ値・重複データの確認、さらにデータのマージやグループ化などの様々なタスクをpandasで行います。

本書では機械学習「初学者向け」にpandasの基本的な操作を解説しています。初歩的な要約統計量の算出やグループ化やダミー変数、さらに文字列や時系列データの基本操作など、幅広い範囲をカバーしています。日々、データを業務で取り扱う機械学習エンジニアやKaggle等のデータ分析競技をやられている方に向けて、pandasを使ったデータ前処理のお役に立てばと思い執筆いたしました。

商品の詳細 - 色・サイズ

色に関して、撮影状況やご使用のパソコン環境により、実物と多少色が異なる場合がございます。サイズに関して、ブランドや商品によって実際のサイズと異なる場合がございますので、ご不明な場合は、出品者にお問い合わせください。


サイズ指定なし
フリーサイズ

本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。

日本語が読みづらくて辛いです

送料・発送方法

※配送方法が複数ある場合はカート内にて変更ができます。
※配送会社の状況等によって、商品到着日が遅れる場合がございます。あらかじめご了承ください。

配送方法 送料 追跡 配送目安
その他(配送無料)¥0なし5日~10日