Entrevista: Tencent Social Advertising University Algorithm Competition en la segunda semana de la final del equipo de mayor progreso - experiencia de competencia de rábano y compartir
La segunda semana de la final del Concurso de Algoritmos Universitarios de Publicidad Social de Tencent
El equipo que más ha progresado
Su nombre esTire del rábano
Este es un equipo de un solo hombre
Y todavía hay muy pocas chicas
Encantadora, bien portado, niña independiente, felicidades
No hay mucho que decir directamente en la foto
El editor en jefe tuvo una breve entrevista con nuestros compañeros de clase de Zhou Progressive Champion
Así que hay la siguiente parte
.....
Hola a todos, soy Feng Yu de la Universidad Jiaoxuan de Shanghai, para participar en la competencia Tencent es también con una mentalidad de aprendizaje, ha sido y sus propios resultados en el juego,Afortunadamente para obtener este premio de progreso también es muy feliz, ya que los jugadores de nivel de entrada en realidad no son muy hábiles en muchas operaciones básicas, la mayor parte de la revancha rastreada en el volumen de datos y la lucha de memoria y las características de extracción, muchos chicos grandes escuchados de los grandes trucos no han tenido tiempo para practicar, sólo quedan unos días, no puede dejar de decir.
Por supuesto, Se ha aprendido mucho en el proceso. En esta clasificación no alta, creo que el gran hombre de primera fila ha pensado que no pensé, porque el uso del modelo de características también ha sido divino, simplemente digo lo que quiero conseguir, y todos trabajamos juntos.
La idea al principio es mencionar las características, luego filtrarlas, luego entrenar los modelos básicos y luego fusionarlas. Debido a problemas de volumen de datos y memoria, hay muchas operaciones irrazonables, a menudo errores similares a un enigma, la depuración también es una cosa que consume mucho tiempo y consume energía. Actualmente no hay fusión característica, sólo xgboost pero el modelo para participar, sentir que hay espacio para la mejora.
1. Eficiencia relacionada
No sólo debemos prestar atención a los resultados de la formación, sino también prestar atención a los costes de tiempo y recursos invertidos, en un tiempo limitado para obtener la máxima mejora posible, creo que en el entorno de trabajo real es el mismo. El código de ejecución inicial de la remath es demasiado lento, o no hay suficiente memoria, corriendo lentamente, etc. Realmente siente que una buena arquitectura de código y modularidad es demasiado importante, las características se pueden dividir en grupos de características para extraer, los conjuntos de datos utilizados a menudo se pueden almacenar en caché, por lo que es más conveniente leer, después de que el error no es fácil de abandonar.
2. Acerca del cruce
En el tema de la división de datos, muchos hombres grandes han subrayado, sin embargo, que el medio todavía tiene la naturaleza general de las características de la psicología de la suerte en todo el conjunto mencionó una característica (también perezosa), el resultado del colapso decisivo de la línea. Actualmente se utiliza o se utiliza un conjunto de entrenamiento de dos días, ya sea que el tamaño de los datos o la eficiencia operativa sea más adecuado.
3. Características relacionadas
Las características son particularmente importantes bajo una propuesta tan compleja como las recomendaciones publicitarias, y las llamadas características determinan la transmisión en vivo. La capacidad de aprender e implementar rápidamente también es importante porque las limitaciones de tablero corto de las habilidades básicas hacen que no sea particularmente útil dejar tiempo para el ajuste del modelo y la fusión. La característica básica es la estadística de entidad única cvr, la entidad cruzada cvr, con suavizado bayesiano también tiene la elevación en el bit milésimo. Las características de falta de deterioro del día son también la mayor fuente de progreso, por supuesto, tenga cuidado de no cruzar. Además, las características de la propia categoría se pueden extraer a través del comportamiento de la interacción y el tiempo. Finalmente, se pasó mucho tiempo analizando y extrayendo las tablas de instalación, principalmente para usuarios y aplicaciones, pero el efecto de mejora no fue tan ideal como se imaginaba.
4. Acerca del modelo
Xgboost y lgb siempre han sido el foco del tema de todos, después de entender los principios de los algoritmos y el significado de los parámetros, puede afinar mejor, primero áspero y luego el ajuste fino también puede mejorar cierta eficiencia. Además, ffm es también un modelo que me gustaría probar, espero que sea demasiado pronto.
Por último, espero que todos podamos ganar en el proceso, aprender a pensar, más intercambios.
Terminar.
Para obtener más información, visite el sitio web oficial del evento en http://algo.tpai.qq.com
Por supuesto, hay:
WeChat oficial de algoritmos llenos de productos secos y regalos:TSA-Contest
Zapatos de niños que tienen miedo de demasiados regalos, por favor presten atención a ellos
Ir a "Descubrimiento" - "Echa un vistazo" navegar "Amigos están viendo"