Cómo WECHAT filtra imágenes para 1 mil millones usuarios

[Visto: 298 veces]

Con más de 1 mil millones usuarios mensuales, WeChat cuenta con el título de la aplicación de chat más popular en China y el cuarto más grande del mundo. Sin embargo, un nuevo informe de los investigadores de Citizen Lab revela exactamente cómo la plataforma es capaz de censurar las imágenes enviadas por estos millones de usuarios.

Basándonos en investigaciones previas que demuestran que WeChat censura imágenes sensibles, este nuevo informe demuestra los fundamentos técnicos de cómo funciona esta censura. En concreto, los hallazgos demuestran que WeChat utiliza dos algoritmos diferentes para filtrar imágenes: un enfoque basado en el reconocimiento óptico de caracteres (OCR) que filtra imágenes que contienen texto sensible y una visual que filtra imágenes que son visualmente similares a los de una lista negra de imágenes.

“La mayoría de la investigación de la censura hasta ahora se ha centrado en medir el bloqueo de sitios web o la censura de chat, mensajes y otros medios de texto”, dice el autor del informe Jeffrey Knockel. “a medida que las imágenes se convierten en un componente cada vez más grande de cómo nos comunicamos en línea, necesitamos también tener una buena comprensión de cómo se implementa la censura de la imagen”.

Y la evidencia sugiere que las imágenes están ganando favor entre los usuarios de WeChat. En un estudio reciente, las imágenes se clasificaron como el tipo de mensaje más preferido compartido en WeChat Moments (similar a la característica de la línea de tiempo de Facebook), superando mensajes basados en texto y videos cortos.

“Entender cómo el líder de la industria lleva a cabo la censura de diferentes formatos de contenido nos ofrece algunas ideas sobre la tendencia de la censura y la dirección de futuras investigaciones”, dice el autor del informe Lotus Ruan.

Para evaluar cómo funciona la censura de imágenes, los investigadores del laboratorio de Citizen idearon una serie de pruebas que revelaron las formas en que los filtros rechazarían o permitirían imágenes en momentos. Descubrieron que el algoritmo basado en OCR tiene detalles comunes a muchos algoritmos estándar de OCR en el que convierte las imágenes a escala de grises y utiliza la combinación de BLOB para consolidar los caracteres. Además, descubrieron que el algoritmo basado en la visual no se basa en ningún enfoque de aprendizaje automático que utilice una clasificación de alto nivel de una imagen para determinar si es sensible o no.

Analizando y entendiendo cómo operan los algoritmos de filtrado basados en OCR y visual, los investigadores descubrieron debilidades en ambos algoritmos que permitirían a un usuario subir imágenes perceptualmente similares a las prohibidas pero que evaden el filtrado.

Por ejemplo, eligiendo el color de fondo del texto de una imagen de tal forma que tanto el texto como su fondo se convierten en el mismo tono de gris después de que WeChat lo convierte a escala de grises permite que el texto aparezca visible para un usuario pero que subvertiría los censores.

Figura 1. A la izquierda hay una imagen de Liu Xiaobo que está bloqueada en WeChat momentos a la derecha, la imagen reflejada. Aunque técnicamente las imágenes tienen píxeles en diferentes posiciones, ambas muestran una representación del difunto Liu Xiaobo, pero sólo la imagen original de la izquierda se filtra. Este resultado significa que simplemente espejar una imagen censurada puede evadir filtros de imagen en momentos WeChat.

De acuerdo con Knockel, este análisis en profundidad arroja luz sobre cómo empresas como Tencent, propietario de WeChat, operan dentro de un entorno como China

“Los algoritmos para realizar este tipo de filtrado de imágenes son computacionalmente caros en términos de tiempo y energía. La realización de este tipo de filtrado es la última cosa que Tencent quiere estar desperdiciando dinero, pero el hecho de que lo hace sugiere que hay una gran cantidad de presión Tencent recibe del gobierno chino para implementarlo. ”

El informe también sugiere que, si bien la censura generalizada en el país no es inmune a la evasión.

“El desarrollo de tecnologías de censura es un juego de gato y ratón.”, dice Ruan. “Si bien la censura en China es omnipresente, las tecnologías que lo permiten no siempre son absolutas. Bajo la presión del gobierno, las empresas seguirán desarrollando nuevos medios para bloquear el contenido. Analizar cómo funcionan estas tecnologías nos ayuda a comprender el alcance del control de la información en China “.

Esta investigación se presenta en el 2018 USENIX de comunicación libre y abierta en el taller de Internet (focos). El documento de focos se complementa con un informe técnico que proporciona un análisis extendido

Puntuación: 0 / Votos: 0

siempretec

Otro sitio más de Blog PUCP

Cómo WECHAT filtra imágenes para 1 mil millones usuarios

Deja un comentario Cancelar respuesta