Los datos sintéticos se generan artificialmente e imitan las patrones, relaciones y distribución estadística de datos reales, permitiendo usarlos con alta utilidad sin revelar información confidencial de personas o sistemas reales.
Su uso está experimentando un patrón de adopción propio de las innovaciones tecnológicas: ciertos sectores y compañías se sitúan a la vanguardia de su implementación, mientras que otros aún se encuentran en etapas iniciales. Dentro de esta dinámica, Softtek ha identificado en su White Paper ‘The rise of Synthetic Data: data without borders’ distintos perfiles y cuál es su curva de adopción.
El primero de los grupos está formado por industrias de alta inversión en I+D y una cultura de la experimentación. Este lo conforman startups de IA, Big Tech, Insurtechs, sector automotriz y las Fintechs emergentes. Mientras, los early adopters se erigen como los líderes en incorporar datos sintéticos y en capitalizar su uso. Entre ellos figuran sectores como la banca y los seguros, empresas farmacéuticas, las grandes empresas tecnológicas y gobiernos como el de Reino Unido o Singapur, que se han adentrado en el ecosistema de los datos sintéticos con el objetivo de mejorar la transparencia y la compartición de datos, pero sin poner en riesgo la privacidad de las personas.
Por otro lado, la industria 4.0, el sector de las telecomunicaciones y las empresas energéticas han comenzado a experimentar los beneficios que ofrecen los datos sintéticos. Ahora son más eficientes y han conseguido optimizar sus recursos.
Impacto de los datos sintéticos por sectores
- Tecnología: permiten mantener la utilidad de la información protegiendo la privacidad de los usuarios. Facilitan entornos de prueba robustos para testing y QA con grandes conjuntos de datos realistas, apoyan la creación de volúmenes masivos de datos para entrenar modelos de IA más precisos y mejoran la ciberseguridad al entrenar sistemas de detección de amenazas sin comprometer información sensible.
- Salud: revolucionan los ensayos clínicos, el desarrollo de fármacos y el diagnóstico asistido por IA. Permiten simular poblaciones de pacientes para optimizar ensayos, reducir tiempos y costos, generar imágenes médicas realistas para entrenar modelos diagnósticos sin usar datos personales, y prever la respuesta de los pacientes a nuevas terapias, acelerando la investigación y disminuyendo gastos. Según expone el White Paper de Softtek, el 30% de todos los datos del mundo es de atención sanitaria y la cifra va en aumento.
- Finanzas: se utilizan para detectar fraudes, probar la resistencia financiera y modelar riesgos. Permiten simular transacciones fraudulentas y redes de lavado de dinero para entrenar sistemas de monitoreo sin comprometer la privacidad de los clientes. También ayudan a generar escenarios de mercado y fluctuaciones, facilitando pruebas de estrés y el cumplimiento regulatorio en entornos volátiles.
- Seguros: permiten desarrollar modelos predictivos más precisos, simular eventos de alto riesgo y cumplir con la normativa. Además, facilitan la detección de fraudes al generar grandes volúmenes de transacciones simuladas, mejorando la eficacia de los sistemas sin comprometer la información de los clientes.
- Gaming y entretenimiento: permiten crear personajes y entornos realistas sin diseñarlos manualmente. También facilitan niveles de juego adaptativos y personalizados que se ajustan a la habilidad del jugador, ofreciendo experiencias más inmersivas y variadas.
- Educación: ofrecen una alternativa cuando el acceso a información real es limitado por privacidad. Permiten generar conjuntos de datos que reflejan características de estudiantes y contextos, facilitando la investigación sobre rendimiento, abandono escolar o el impacto de distintas intervenciones.
- Transporte y movilidad urbana: permiten crear simulaciones de movilidad calibradas con conteos reales, ayudando a planificar infraestructuras y ciudades inteligentes. Ciudades como Singapur usan estos gemelos digitales para prever congestión, probar cambios en vías o nuevas líneas de transporte, y analizar el impacto en los desplazamientos sin intervenir en la vida real.
- Administración pública: permite mejorar la eficiencia y proteger la información sensible. Facilitan la creación de conjuntos de datos que conservan las características de los reales sin comprometer la privacidad, promoviendo la colaboración entre organismos y acelerando la innovación en políticas, investigación y detección de fraudes.
- Retail y comercio electrónico: permiten modelar el comportamiento del consumidor, analizar patrones de compra y anticipar demandas. También facilitan la personalización de la experiencia de cada cliente, recomendando productos y ofertas adaptadas a sus preferencias. Además, ayudan a optimizar la gestión de inventarios, simulando distintos escenarios de demanda y mejorando la toma de decisiones sin depender únicamente de datos históricos reales.
- Industria manufacturera: se aplican en la creación de gemelos digitales, permitiendo simular procesos y operaciones de manera segura antes de implementarlos en la realidad. También se utilizan para mejorar el control de calidad, anticipar fallas mediante mantenimiento predictivo y optimizar procesos de producción, aumentando la eficiencia y reduciendo costos sin depender únicamente de datos reales.
Doris Seedorf, CEO de Softtek para España, explica: “los datos sintéticos están cambiando la manera de innovar y tomar decisiones. Al permitir trabajar con conjuntos de datos realistas sin comprometer la privacidad, las empresas y gobiernos pueden experimentar, optimizar procesos y entrenar modelos de IA de manera más rápida y segura. Esto no solo acelera la innovación, sino que también abre la puerta a nuevas oportunidades en sectores como la salud, las finanzas, la educación o el entretenimiento”.





