テンセントソーシャル広告アルゴリズムコンテストBaseline
1
はじめに
広告アルゴリズムコンテストは、開始から約1週間で開催され、現在16,208人の選手が登録され、3847人の選手が認定を完了し、904チームが効果的に提出されています。 このパブリック番号より前の 2 つの記事では、pCVR と pCTR の同一性を比較したデータ マイニング コンテストの一般的なプロセスについて説明しました。 この記事では、このコンテストに焦点を当て、いくつかのBaselineを与えます。
2
タスクの詳細
このタスクは、アプリ広告のコンバージョン率の見積もりであり、ユーザーがアプリ広告をクリックした後にアプリをアクティブにする確率を推定し、pCTR タスクに似た古典的な 2 つの分類の問題です (両者の類似点と類似点は、パブリック番号の前回の記事「クリック率予測の視点からテンセント ソーシャル広告アルゴリズム コンテストを見る」を参照してください)。
このコンテストは、ユーザーの基本的な属性画像、広告クリックログ、アプリのインストールリスト、インストールフローなど、さまざまなデータを提供します。 特徴工学とモデルトレーニングのためのより大きな遊びスペースを提供し、また、いくつかの課題を提起します。
3
Baseline
ここでは、Python の使用方法、フィーチャのコーディング、モデルのトレーニング、および準拠したコミット ファイルの生成方法を示す 2 つの Baseline を公開します。 コードは Github に配置され、アドレスは次のアドレスに配置されます。https://github.com/TSA-Contest/tsa-contest-baseline(テキストの最後に全文を読むには、自動ジャンプリンクをクリックしてください)
3.1 Version 1
概要: この Baseline は、ad.csv の creativeID/adID/appID などの履歴統計平均コンバージョン率を、テストセット内の対応する creativeID/adID/appID 対応サンプルの予測結果として使用します。
3.2 Version 2
概要: この Baseline で使用される ad.csvのフィールドに追加され、単純な one-hot エンコード後に Logistic Regression を使用してモデル化されます。
4
結び目
この記事では、Python を使用して効果的なコミットをモデル化および生成する方法を示す、アルゴリズム コンテストの簡単な Baseline をいくつか示します。 これら 2 つの Baseline は、それぞれ統計的および機械学習的なアプローチを使用し、両者の違いを経験した後、機械学習アプローチに大きな可能性を秘めています。 競技者は、データ前処理、特徴工学、モデルモデリングなど、さまざまな側面から想像力を引き出し、徐々に成果を上げることができます。
詳細については、イベントの公式サイト(http://algo.tpai.qq.com
コンテストの応募チャネル: http://algo.tpai.qq.com/person/mobile/index
もちろん、登録方法:
一言も言わないで贈り物を贈るアルゴリズムコンテスト公式WeChat:TSA-Contest
プレゼントが多すぎる子供の靴が怖いので、ご注意下さください
[全文を読む] をクリックして Baseline に移動します
「発見」-「見る」に移動し、「友人が見ている」を参照します。