2021-01-01から1年間の記事一覧

その予測、必要ですか?~意思決定分析と予測の活用を読んで~

この記事は? 二値分類モデルの良さってconfusion matrixなの? 意思決定のモデル化 問題の構成要素 行動 自然の状態 利得 今回の問題において そもそも、予測する価値はあるのか?どれくらい予測することにコストをかけるのか? 決定木分析 予測なしで意思…

Signateコンペでみる時系列データの定常性の影響~intro~

この記事は? コンペ内容 時系列データって何を気を付けなければいけないの? この記事は? Signateコンペ日本取引所グループ ファンダメンタルズ分析チャレンジを題材に、時系列データの取り扱いで勉強したことを共有する記事です。時系列データの取り扱い…

MMM(マーケティングミックスモデル)をRobynでやってみた

この記事は? MMMとは? MMMを何のために使うか? MMMは何を行うのか RobynでMMMやってみた チュートリアルでの問題設定 プログラムの実行 アウトプットの解釈 問いに答えるためのアウトプット(クライアントに見せる系) 各要因の売り上げへの寄与割合 時系…

Machine Learning Design Patternsの要約と実務経験からの感想

この記事は? Machine Learning Design Patternsの概要 Capter8 MLプロジェクトのパターン MLのライフサイクル Discovery ビジネスユースケースの定義 データ探索 Development アルゴリズム選択 データパイプライン特徴量エンジニアリング モデル作成 結果の…

DataMeshの論理アーキテクチャ

この記事は? 運用データと分析データの断絶 DataMeshの論理アーキテクチャと原則 ドメインオーナーシップ 論理アーキテクチャ:ドメイン指向データ Data as a product 論理アーキテクチャ:データプロダクトはアーキテチュラルクオンタムである セルフサー…

Data Meshについての調査

この記事は? 現在の企業のデータアーキテクチャ データアーキテクチャ失敗パターン 一元化されモノシリック パイプラインの分割 分断されたオーナーシップ 次世代のエンタープライズデータプラットフォームアーキテクチャ データと分散ドメイン駆動アーキテ…

競馬予測システムでMLOps実践~回収率140%でぬか喜びした話~

要点 回収率140%..?(時系列データの評価方法って難しいねという話) 競馬予測システムの作り方 機械学習で解きたい問題を明確にする 継続的にデータを収集する データバリデーションをする モデルの性能監視・可視化を行う パイプライン化・自動化して運用…