Google pide a los sitios web que por favor no rompan su nueva API de publicidad dirigida • The Register
7 min readGoogle planea enviar su API de temas cuando llegue Chrome 115 el 12 de julio. Es la API que se supone que permite a los anunciantes dirigirse a los usuarios de Internet con anuncios adaptados a sus intereses individuales sin entrometerse en la privacidad de las personas.
Y para ayudar a prevenir estos problemas de privacidad, el gigante publicitario está pidiendo a los anunciantes que prometan que no abusarán de este mecanismo de orientación de anuncios.
El pasado mes de mayo, Alexandre Gilotte, científico de datos sénior e ingeniero de software de la empresa de plataformas publicitarias Criteo, inauguró una discusión de los problemas de GitHub describiendo un posible ataque de huellas dactilares en la API de temas que podría usarse para identificar personas en línea.
El jueves pasado, con Google preparándose para hacer temas disponible el próximo mes en ChromeJosh Karlin, CTO y Project Manager de Privacy Sandbox de Google, cerró la discusión de un año.
“Desde esa discusión, agregamos un requisito en Chrome que los desarrolladores inscribir usar la API y certificar que no abusarán de ella”, dijo. escribiendo. “No es una solución técnica, pero creo que contribuirá en gran medida a resolver este problema. Cerrado por ahora”.
Sin embargo, la pregunta sigue siendo si otros fabricantes de navegadores admitirán alguna vez la API. Los dos creadores de Firefox MozillaComentario y desarrollador de Safari Manzana indicaron que se oponían a los temas propuestos.
Simplemente no vemos una manera de hacer que esto funcione desde una perspectiva de privacidad.
“Básicamente, simplemente no vemos una manera de hacer que esto funcione desde una perspectiva de privacidad”. ha dicho El ingeniero distinguido de Mozilla, Martin Thomson, en enero en respuesta a una solicitud de Karlin para un puesto oficial.
“Aunque la información proporcionada por la API es escasa, creemos que es más probable que reduzca la utilidad de la información para los anunciantes que brinde una protección de privacidad significativa. Desafortunadamente, es difícil identificar formas concretas de mejorar esto”.
Anne van Kesteren, que trabaja en estándares web en Apple, nombró diez problemas con la API y dicho iGiant se opone. “No creemos que los datos entre sitios sobre el comportamiento de navegación del usuario deban exponerse en las API”, dijo. “Hemos estado trabajando durante diez años en la dirección opuesta, dividiendo los datos por sitio de nivel superior”.
Google, que descontinuó su anterior API basada en intereses, Federated Learning of Cohorts (FLoC) el año pasado, sigue adelante con Topics porque necesita algo que permita la publicidad basada en intereses una vez que el ya retrasado deterioro de las cookies de terceros ocurrir en el tercer trimestre de 2024.
Operación API
EL API de temas es una de las muchas propuestas de preservación de la privacidad para la gestión de publicidad digital una vez que se elimine el soporte para cookies de terceros. Como parte de lo que Google ha llamado Privacy Sandbox, Topics proporciona un mecanismo para entregar anuncios que coincidan con los intereses percibidos de los usuarios de Internet.
Básicamente, cuando un usuario visita un sitio web y el sitio web desea mostrar un anuncio, el sitio web puede ejecutar código JavaScript (o verificar el encabezado de solicitud Sec-Browsing-Topics) para recuperar una lista de tres temas máximos, de una taxonomía de varios cientos categorías de interés, derivadas de las visitas anteriores del usuario al sitio web. Esto permite que el sitio publique un anuncio que se considere relevante para las áreas de interés conocidas del visitante.
“Con Temas, su navegador determina un puñado de temas, como ‘Fitness’ o ‘Travel & Transportation’, que representan sus principales intereses para esa semana en función de su historial de navegación”. explicar Vinay Goel, director de producto de Privacy Sandbox en Google, el año pasado.
“Los temas solo se conservan durante tres semanas y los temas antiguos se eliminan. Los temas se seleccionan completamente desde su dispositivo sin involucrar ningún servidor externo, incluidos los servidores de Google. Cuando visita un sitio participante, Temas selecciona solo tres temas, un tema de cada uno de los últimas tres semanas, para compartir con el sitio y sus socios publicitarios”.
En ocasiones, la API también puede devolver un tema aleatorio. En navegadores conscientes del tema, como el próximo Chrome 115, una página web que invoque la API…
const topics = await document.browsingTopics();
…podría devolver una matriz formateada como esta…
[{'configVersion': String, 'modelVersion': String, 'taxonomyVersion': String, 'topic': Number, 'version': String}]
…donde está “Número” uno numerado taxonomía de intereses predefinidos. El valor “1” se refiere a “/Artes y entretenimiento”, mientras que el número 277 se refiere a “/Empleos y educación/Educación/Estudio de idiomas extranjeros”.
Armado con esta información, el código de la página web podría solicitar un anuncio relacionado con el tema, lo que idealmente atraería mejor al visitante de la web y generaría más ingresos, ya que el anunciante pagaría una prima para llegar a la audiencia deseada.
La preocupación de Gilotte es que un editor web podría implementar la API de temas al incluir el JavaScript requerido en varios sitios web y luego crear una identificación de huella digital basada en el comportamiento de los sitios web para el usuario.
La API de temas tiene un requisito de “cookie”: solo revela el interés de un visitante en un tema si el sitio ha recibido previamente datos en esa categoría de tema. Por lo tanto, una secuencia de comandos en una página web que observa a un usuario que visita un sitio de noticias podría saber que el usuario tiene afinidad por las noticias, pero no que el usuario está interesado en, por ejemplo, comprar.
Esta regla, que Google llama su “requisito de detección por persona que llama” Y poder ayudar Google más que las empresas más pequeñas con menos visibilidad de visitas a la web: se puede aprovechar para ganar algo de entropía de los visitantes: ya sea que el sitio haya visto el tema o no.
Con suficientes bits de entropía, obtienes una huella digital: estamos hablando de docenas de sitios web durante semanas de observación. Según Thomson de Mozilla, 20 bits permiten una en un millon de diferenciacion. Y desarrolla sus inquietudes en un documento [PDF] publicado en enero titulado “Un análisis de privacidad de la propuesta de temas de Google”.
“Llegamos a la conclusión de que Topics tiene importantes problemas estructurales de privacidad que son difíciles de resolver”, escribió Thomson.
la respuesta de google
En un intento por abordar algunas de las preocupaciones que han surgido, Karlin y otros en Google dicen que Topics ofrece una mejor privacidad que las cookies de terceros, que no ofrecen mucha privacidad. En abril, él y diez colegas liberaron un documento [PDF] describiendo las matemáticas para evaluar esta afirmación.
Y a principios de este mes, Google anuncio algunos cambios en la API de temas.
Hay una nueva taxonomía de 469 temas de interés, frente a los 349 anteriores. Este es más pequeño que el Taxonomía de las audiencias de IAB, que según Google contiene alrededor de 1.500 temas. Se agregaron unas 280 categorías orientadas a los negocios, como ropa deportiva, colchones y viajes de lujo, mientras que se eliminaron 160 categorías menos monetizables, como ingeniería civil y equitación.
“Elegimos limitar el tamaño de la taxonomía para protegernos contra el riesgo de reidentificación”, explicó Leeron Israel, gerente de producto de Google Privacy Sandbox.
Google, dijo Israel, también planea permitir a los usuarios bloquear temas específicos. “Esto significa que los usuarios podrán organizar el conjunto de temas disponibles que les interesen eliminando los temas seleccionados”, dijo. “Este cambio, que llegará a principios del próximo año, dará a los usuarios aún más control sobre su privacidad y hará que la API de temas sea aún más fácil de usar”.
Mozilla se mantiene escéptico.
“No estamos interesados en crear funciones que revelen el historial de navegación de los usuarios”, dijo un portavoz de la compañía. El registro en un correo electrónico.
“Google se contenta con usar poco ruido para brindar una sensación de privacidad. Aleatorizar los datos a una tasa de uno en veinte puede reducir su efectividad para la publicidad, pero eso no es un consuelo para aquellos que se vuelven a identificar usando esta información”.
Obviamente habrá un interruptor de apagado. ®
“Adicto a la televisión total. Experto en viajes. Gurú de Twitter. Evangelista de tocino. Creador galardonado. Aficionado al alcohol. Fanático de la música. Solucionador de problemas”.