【インタビュー】テンセント・ソーシャル・アドウェア・アカデコ・アルゴリズム・コンテストの第2週のチャンピオン、Grootコンテストの経験と心が共有されました
緊張と激しい競争の別の週の後
テンセントのソーシャル広告大学アルゴリズムコンテストは、第2週のチャンピオンを生み出しました
名前はGrootです
3人の冷静な大きな男の子
低い実力者、おめでとうございます
Xiao編集長は、私たちのZhouチャンピオンのクラスメートとの短いインタビューを行いました
そして、この共有は、次の記事です
.....
こんにちは、私たちはGrootチームです、私はGrootチームのキャプテンwsssであり、2人の選手、gjj、馬をつかみ、現在は中国科学技術大学の大学院生であり、この大会の経験を共有する機会を光栄に思います。 KaggleのBosch Production Line Performanceに初めて参加し、成績は良くなかったが、いくつかの経験を積み、皆の努力と相まって、この大会で1週間優勝した。
ここでは、主にこのコンテストで私たちのアイデアのいくつかを紹介し、うまくいけば、すべての人を助けることができます:
1. トレーニングセットの構築
グオ・ダヤ・ダオの以前の共有経験と同様に、ゲームの初期に最も重要なのは、効果的なトレーニングセットを構築し、オンライン状況と可能な限り同期し、データセット分割スキームは、テンセント広告アルゴリズムコンテストの公式公開番号の推薦参照いくつかのコンテストの情報を参照することができます。 訓練集合を構築した後,一般に,オンラインとオフラインのギャップが比較的大きい場合,抽出した特徴が情報漏えいしている可能性や,提出データ部分の特徴抽出が訓練セット上で抽出された特徴方式と大きく異なる可能性がある.
2、モデルの選択
今、多くのモデルを選択することができます、今、我々は他のモデルと比較して、トレーニングフィードバックプロセス全体が比較的迅速であり、以前の迅速な特徴の反復を容易にし、おそらく後にいくつかの異なるモデルを試して、私たちの主な焦点は、特徴工学の部分にあるので、我々はXGBを選択します。
3、特徴工学
以前のデータ前処理などのプロセスを除いて、ゲームの作業の大部分は特徴工学であるべきであり、私たちの一時的な考え方によると、最も重要な特徴の1つは、以前の同様の競争の共有経験を参照し、他の部分は、このデータの理解のために、一般的にいくつかの統計分析を行い、もう一つは、あなたが構築したデータセットで、生データを観察し、我々は選択的にいくつかのlabel=1ユーザーにいくつかの分析を行い、彼の歴史的相互作用のために、 アプリなどの情報をインストールし、ユーザーの視点から広告をクリックした後にアクティブ化が発生する理由を考えることで、いくつかの可能な特徴を抽出し、その後、特徴の抽出と検証を行い、現在の特徴数とモデルが比較的小さいため、完全なトレーニングと予測は基本的に数十秒で完了するため、特徴のスクリーニングやxgbfirなどのツールを使用して特徴を分析する方が便利です。 一般に、特性の分析は、データの理解をある程度深め、いくつかの可能な特性間の相関関係を発見します。
4、機器
初戦のデータサイズも許容され、私たちのプログラムは、基本的に多くの最適化を行っていない、おそらく少し大きなメモリは、あなたが観察するためにデータ全体をロードするのに便利ですが、特性と後のトレーニングセクションのために、基本的なリソースはほとんど消費されません、平均的なラップトップは完了するのに十分です。
感想:
全体的に、この週のチャンピオンは、いくつかの巧妙な合成ポイントを取る、私たちの経験は十分ではありませんので、間違った場所があり、我々はまた、あなたがより多くの理解を持っていることを願っています。 同様のコンテストに出場していない学生のために、我々は、最終的に理想的な結果を達成していない場合でも、あなたが試合後に勝利チームを共有することは、あなたが多くを学ぶので、我々は、まだ参加するべきだと感じています。うまくいけば、誰もがゲームを通して何かを学び、成長することができます。
最後に、私はすべてのコンテストで良い結果をお祈りします!
終わりだ
詳細については、イベントの公式サイト(http://algo.tpai.qq.com
コンテストの応募チャネル: http://algo.tpai.qq.com/person/mobile/index
もちろん、登録方法:
一言も言わないで贈り物を贈るアルゴリズムコンテスト公式WeChat:TSA-Contest
プレゼントが多すぎる子供の靴が怖いので、ご注意下さください
クリックして全文を読み、今すぐ参加してください
「発見」-「見る」に移動し、「友人が見ている」を参照します。