Sección 01
Resumen Ejecutivo
La irrupción masiva de los grandes modelos de lenguaje (LLMs) en los últimos años
ha alterado de forma estructural la cadena de valor de la edición literaria y de
la evaluación académica. Texto generado por máquina, indistinguible para un lector
humano no entrenado, convive con texto genuinamente humano en flujos editoriales,
tesis universitarias, opiniones jurídicas y reportajes periodísticos.
El daño reputacional y legal de no poder distinguir uno de otro es asimétrico:
un humano acusado falsamente de usar IA pierde una obra, un autor o una nota;
una IA confundida con un humano contamina un catálogo, un repositorio universitario
o un archivo público.
Dos principios rectores
Liberitas es un sistema de detección de IA en español de grado de
producción, diseñado en torno a dos principios rectores:
Cero falsos positivos en literatura
Para una editorial, marcar a un autor humano como IA es un fallo
catastrófico. Calibramos el sistema para que el FPR sobre literatura
humana de control caiga a niveles residuales.
Trazabilidad criptográfica
Cada decisión queda firmada en un registro inmutable. Años después se puede
reconstruir qué análisis produjo qué veredicto sobre qué texto exacto.
El programa Sello Liberitas opera sobre ese motor para emitir
certificaciones editoriales públicamente verificables ("Obra sin IA Detectada")
asociadas al hash criptográfico SHA-256 del manuscrito original.
Resultados observados sobre cohortes de validación
Nota metodológica. Las cifras siguientes corresponden a
resultados observados sobre una cohorte de 1.400 manuscritos
públicos nunca vistos por el sistema (922 humanos recogidos de repositorios
institucionales españoles + 478 generados por cinco modelos de lenguaje
comerciales, incluyendo uno nunca presente en el corpus de entrenamiento).
El filtrado anti-leakage por identificador documental es reproducible. Las
cifras son representativas pero no constituyen garantía contractual
de rendimiento sobre cualquier manuscrito futuro: el comportamiento real
depende del tipo de texto, su longitud, su género y el estado del arte de
los modelos generativos en cada momento.
100 %
NPV (valor predictivo negativo)
0 %
FPR sobre cohorte humana (922 docs)
100 %
Recall sobre cohorte IA (478 docs, 5 LLMs)
100 %
Accuracy sobre decisiones firmes
Liberitas combina (a) modelos fundacionales nativos en español desarrollados por
instituciones públicas españolas, (b) un ensemble neuronal con
múltiples capas de veto, (c) calibración estadística por longitud y por
género literario, y (d) un registro criptográfico trazable y reproducible.
Sección 02
Contexto y Problema
El cambio de paradigma
En los últimos años, la generación de texto por LLMs ha pasado de artefacto
detectable a oficio especializado. Tres dinámicas han desactivado la mayor parte
de los detectores de primera generación:
- Humanización adversarial. Herramientas que reescriben la
salida de un LLM para que pierda los marcadores estilísticos típicos.
- Modelos multilingües más grandes. Producen castellano fluido
que ya no comparte la "huella" de los detectores anglocéntricos entrenados
sobre modelos antiguos en inglés.
- Edición humana parcial. El caso más frecuente es un texto
parcialmente IA con intervención humana posterior. Cualquier detector que
tome una decisión binaria sobre la obra completa fracasa cuando una parte es
IA y otra no.
Asimetría de costes para una editorial
Para una editorial, los dos tipos de error tienen consecuencias muy distintas:
| Error |
Coste |
Falso Positivo humano marcado como IA |
Catastrófico: ruptura con el autor, daño reputacional, riesgo
legal. |
Falso Negativo IA marcada como humano |
Asumible si está acotado: corrección posterior, revocación
pública. |
Esta asimetría justifica que el sistema esté deliberadamente sesgado a
no certificar en caso de duda.
Asimetría de costes para una universidad
En el flujo universitario la asimetría es la opuesta: el coste de
no detectar un TFG generado con IA es mayor que el coste de pedir
una revisión humana sobre un caso dudoso. Por eso el sistema expone dos modos
operativos con criterios distintos: uno de alta sensibilidad para uso académico y
otro de alta especificidad para emisión de sello.
Sección 03
Solución: Liberitas y el Sello Liberitas
Liberitas (motor)
Liberitas es un motor de detección que combina varias capas
complementarias:
- Análisis neuronal con modelos nativos en español,
fine-tuneados específicamente para detección de IA frente a corpus humano de
referencia.
- Detectores de patrones lingüísticos sobre fenómenos
documentados que distinguen escritura humana de escritura generada
(tipografía, vocabulario, retórica, estructura, hedging, caracteres
invisibles, anomalías de lengua, densidad formal).
- Análisis estadístico del texto (variabilidad de longitud de
frases, diversidad léxica, uniformidad sintáctica).
- Inspector de metadatos de PDF y DOCX (autor declarado,
herramienta de creación, fechas de producción).
- Calibración estadística por longitud y por género para que el
comportamiento del sistema sea fiable en contextos muy distintos.
- Decisión tri-estado:
humano /
inconcluso / IA. El estado intermedio existe
precisamente para no forzar decisiones en zona gris.
Sello Liberitas (certificación)
El Sello Liberitas es un programa de certificación criptográfica
construido encima del motor, con criterios deliberadamente más estrictos que el
modo académico:
Análisis granular
El texto se evalúa en segmentos para capturar obras parcialmente IA donde
un capítulo podría ser generado y el resto humano.
Veto por género
Para emitir el sello hay que pasar varios criterios estadísticos calibrados
según el género literario de la obra.
Veto multi-componente
Cualquier capa que detecte indicios suficientes bloquea la emisión, aun
cuando otras aprueben.
Audit log inmutable
Cada decisión queda firmada criptográficamente y encadenada en un registro
mensual inviolable.
Verificación pública
Cualquier tercero puede confirmar la autenticidad de un sello vía su
identificador único.
Apelación documentada
Procedimiento con plazo máximo de 7 días hábiles para
revisión humana, también firmada en el registro.
Sección 04
Principios de Diseño
Los siguientes principios guían cada decisión técnica del sistema:
1. Verum in dubio pro humano
Ante la duda, el sistema no marca el texto como IA. Las cohortes
literarias de control (clásicos españoles, TFG humanos verificados) se usan para
fijar el umbral hasta que los Falsos Positivos caen a niveles residuales.
2. Trazabilidad por encima de magia algorítmica
Cada cifra del sistema está trazada a una versión concreta de modelo y a un conjunto
de pesos firmado. No publicamos métricas que no podamos reproducir.
3. Defensa en profundidad
Ningún componente decide solo. La certificación exige el acuerdo de varios análisis
independientes. Si cualquiera detecta indicios, no hay sello —aunque los otros
aprueben.
4. Adversarialidad anticipada
El corpus de entrenamiento incluye textos generados por los principales LLMs
comerciales modernos en español y sus variantes humanizadas (light y
heavy) para simular las herramientas de evasión que un atacante real
usaría.
5. Auditabilidad legal
El registro de auditoría es el ancla probatoria del sistema. Está diseñado para que
reescribir entradas pasadas invalide automáticamente todas las posteriores y se
detecte en una pasada de verificación.
6. Honestidad sobre los límites
Lo que el sello no garantiza está explícitamente documentado (sección 8). No
prometemos detectar modelos generativos futuros ni distinguir una corrección
ortográfica de una asistencia masiva.
Sección 05
Arquitectura del Sistema (Vista General)
Pipeline conceptual
Documento (PDF / DOCX / TXT / MD)
│
▼
Extracción de texto y metadatos
│
▼
┌────────────────────────────────────────────────────────┐
│ Análisis multi-capa (en paralelo) │
│ · Detectores de patrones lingüísticos │
│ · Análisis estadístico del texto │
│ · Inspector de metadatos del documento │
│ · Ensemble neuronal de modelos nativos en español │
└────────────────────────────────────────────────────────┘
│
▼
Agregación calibrada → score + decisión tri-estado
│
├─────────────────────────────────────┐
▼ ▼
Modo Académico Modo Certificación
(informe + anotación visual) (veto multi-componente)
│
▼
Audit log inmutable + cert_id
Decisión tri-estado
| Resultado |
Significado operativo |
| humano |
Patrones consistentes con escritura humana. Candidato a sello.
|
| inconcluso |
Señales contradictorias o insuficientes. Requiere revisión humana.
|
| IA |
Indicios convergentes de generación automática. |
El estado inconcluso es una decisión deliberada de no
decidir. Es preferible delegar al juicio humano que emitir una falsa
garantía.
Análisis granular por segmentos
Para manuscritos extensos (libros, tesis), el sistema segmenta el texto en bloques
y aplica el análisis completo a cada bloque, agregando posteriormente los
resultados con criterios estadísticos robustos. Esto permite detectar el caso real
más frecuente: un manuscrito mayoritariamente humano con uno o varios capítulos
generados por IA.
El criterio de agregación evita rechazar una obra entera por un único bloque
anómalo: el veto exige acuerdo de varios segmentos antes de activarse.
Sección 06
Validación y Resultados
Cohortes de validación
El sistema se valida sobre cohortes independientes construidas a partir de
manuscritos públicos de repositorios institucionales españoles (descarga
vía OAI-PMH), garantizando mediante hash SHA-256 que ningún manuscrito del
benchmark estuviera presente en el corpus de entrenamiento:
- Cohorte académica humana. Trabajos de fin de grado y
máster defendidos antes de la generalización de los LLMs, recogidos de
dos universidades politécnicas públicas (varias disciplinas técnicas).
- Cohorte de manuscritos largos académicos. Tesis
doctorales y libros publicados por repositorios universitarios y por
un organismo público de investigación de ciencia básica.
- Cohorte humanística y literaria. Libros, tesis y
manuscritos de literatura clásica española, poesía, teatro del Siglo
de Oro, tratados religiosos históricos, historia del arte, crítica
cinematográfica y leyendas — recogidos de un repositorio universitario
público de gran biblioteca histórica.
- Cohorte adversarial IA. Textos generados con LLMs
comerciales modernos no presentes en el corpus de entrenamiento del
motor, en sus variantes original, light humanización y
heavy humanización.
- Cohorte mixta. Textos parcialmente IA con intervención
humana posterior.
Resultados clave (29 mayo 2026)
Validación sobre 1.400 manuscritos con metodología
anti-leakage por identificador documental (922 humanos + 478 IA generados
con 5 modelos de lenguaje comerciales, incluyendo uno nunca presente en
el corpus de entrenamiento):
| Métrica |
Comportamiento sobre cohorte limpia |
| NPV (valor predictivo negativo) |
100 % |
| FPR global sobre cohorte humana (922 docs) |
0 % |
| FPR sobre literatura humanística y poesía clásica españolas |
0 % |
| FPR sobre tesis doctorales y libros académicos largos |
0 % |
| FNR sobre cohorte IA (478 docs, 5 LLMs) |
0 % |
| Recall sobre cohorte IA |
100 % |
| Detección sobre modelo IA nunca presente en train |
100 % (cohorte de 30 manuscritos) |
| Accuracy sobre decisiones firmes |
100 % |
| Cobertura por género |
novela · ensayo · poesía · cuento · académico · no-ficción ·
periodismo · teatro · educativo |
Interpretación
El sistema de producción está calibrado a favor de los Falsos
Negativos (preferimos no detectar un IA antes que marcar un humano
como IA). Esta es una decisión consciente y documentada, alineada con la asimetría
de costes para una editorial.
Para casos de uso universitario donde el coste de no detectar es mayor, el sistema
expone un modo de operación más sensible que devuelve inconcluso en
zona gris en lugar de humano, forzando revisión académica.
Reproducibilidad
Cada decisión emitida por el sistema queda asociada a la versión exacta de los
modelos y a los pesos firmados que la produjeron. Una auditoría externa puede
solicitar reproducir un veredicto histórico y obtendrá el mismo resultado
siempre que se conserve la misma versión de modelo.
Sección 07
Gobernanza, Auditoría y Trazabilidad
Audit log inmutable
Toda decisión —positiva o negativa— produce una entrada en un registro mensual
append-only. Cada entrada contiene:
- Identificador único de la certificación (
cert_id).
- Timestamp UTC ISO-8601.
- Decisión final.
- Género literario declarado.
- Metadatos del autor / título / ISBN (declarados por la editorial).
- Hash criptográfico SHA-256 del texto del manuscrito.
- Recuento de palabras.
- Versiones de modelos y calibración activos en el momento.
- Resumen del análisis (estadísticas agregadas por bloque).
- Hash de la entrada anterior (encadenamiento criptográfico).
- Firma HMAC-SHA256 sobre la entrada canónica.
Garantías criptográficas
Hash-chain SHA-256
Cada entrada referencia el hash de la línea anterior completa. Modificar
una entrada antigua invalida el encadenamiento de todas las posteriores y
se detecta en una pasada de verificación.
HMAC-SHA256
Cada entrada se firma con una clave secreta custodiada según prácticas
estándar de gestión de claves criptográficas (vault / KMS). Sin la clave,
generar entradas auténticas es computacionalmente inviable.
Canonicalización JSON
La firma se calcula sobre una serialización determinista, garantizando que
dos representaciones del mismo objeto produzcan la misma firma.
Verificación pública
Cualquier tercero puede verificar la autenticidad de un sello sin acceso al log
completo:
- Consulta del
cert_id en el endpoint de verificación pública.
- Comparación del SHA-256 del manuscrito actual contra el SHA-256 registrado en
el momento de emisión.
- Consulta del estado de integridad del registro mensual.
La verificación devuelve la entrada original más los eventos de override
posteriores (revocaciones, apelaciones aceptadas), de modo que el estado público
de un sello refleja siempre la última decisión auditada.
Procedimiento ante una disputa legal
- Localización del
cert_id en el log mensual
correspondiente.
- Verificación integral del archivo mensual completo para
descartar manipulación.
- Reproducibilidad: el campo
model_versions permite
recargar exactamente la combinación de pesos que produjo la decisión. El campo
text_sha256 permite verificar que el manuscrito presentado en
juicio es el mismo que el sistema evaluó.
- Re-evaluación con esos pesos. Si los scores coinciden, la
decisión queda probada como producto determinista del sistema en esa fecha.
Sección 08
Marco Legal del Sello
Naturaleza del Sello
El Sello Liberitas es una declaración técnica firmada sobre el
resultado de un análisis automatizado. No es un dictamen pericial
notarial ni una declaración jurada sobre la autoría última del texto.
Su valor probatorio reside en la trazabilidad criptográfica y la reproducibilidad
del análisis, no en una garantía absoluta de "escrito por humano".
Qué DECLARA el sello
El análisis automatizado realizado por el sistema Liberitas, en la versión
vigente a la fecha indicada, sobre el manuscrito con el hash SHA-256
registrado, no detectó indicios de generación por inteligencia artificial
superiores a los umbrales calibrados de dicha versión.
Qué NO garantiza el sello
- No garantiza que la obra haya sido escrita íntegramente por
un humano sin asistencia menor (correctores ortográficos, búsqueda de
sinónimos, traducción puntual). El sello es sobre detección
automatizada, no sobre autoría notarial.
- No garantiza inmunidad frente a modelos generativos futuros.
La evaluación se hace bajo el estado del arte de la fecha de emisión.
- No sustituye el juicio editorial humano en casos
inconcluso o premium_required.
Procedimiento de apelación
Existen dos vías documentadas:
- Apelación de denegación. El autor o la editorial solicitan
reconsideración aportando evidencias (borradores previos, historial de
versiones, capturas, drafts).
- Solicitud de revocación. La editorial retira un sello
previamente emitido (auto-denuncia o detección de manipulación posterior).
Servicio de nivel garantizado
Ambos eventos se registran de forma firmada. SLA de resolución:
7 días hábiles para la revisión humana.
Revocación
Un sello puede revocarse en los siguientes casos:
- Manipulación post-emisión: el SHA-256 del texto actual no
coincide con el registrado, indicando alteración del manuscrito después de
obtenido el sello.
- Auto-denuncia editorial.
- Hallazgo posterior: revisión humana o auditoría externa
demuestra que el sello fue emitido sobre un manuscrito que no debería haberlo
recibido.
El estado revocado queda en el registro con su cert_id original y es
visible públicamente en la verificación.
Sección 09
Casos de Uso
Editoriales
Flujo típico:
- La editorial sube el manuscrito final junto con metadatos del autor, título,
ISBN y género literario.
- El sistema analiza, aplica los criterios de veto y devuelve un identificador
único de certificación.
- Si el resultado es positivo, la editorial incorpora el identificador en el
colofón del libro y/o en la ficha web. Cualquier lector, librero, biblioteca o
investigador puede verificar la autenticidad de forma pública.
- Si el resultado es negativo o inconcluso, se abre el procedimiento de
revisión humana y, en su caso, apelación.
Beneficios:
- Diferenciador comercial verificable frente a la sospecha generalizada del
lector.
- Marco claro para responder a denuncias de uso de IA en el catálogo.
- Trazabilidad legal en caso de disputa con autor o tercero.
Universidades
Flujo típico:
- El estudiante o el sistema de gestión académica sube el TFG / tesis.
- El sistema produce un informe con anotaciones por segmento, scores por sección
y decisión tri-estado.
- El tribunal o el director revisa el informe; los segmentos
inconcluso o IA son objeto de conversación con el
alumno.
Beneficios:
- Material concreto para defender una decisión académica.
- Reducción del coste de revisión: el evaluador llega ya al fragmento
sospechoso.
- Trazabilidad para procedimientos disciplinarios.
Auditoría editorial post-publicación
Una editorial, un medio o un instituto literario pueden auditar una obra
publicada sometiéndola al sistema y comparando contra el identificador de
certificación original, detectando manipulaciones posteriores a la emisión del
sello.
Integración B2B vía API
Todos los endpoints del sistema son consumibles programáticamente. Los flujos
típicos incluyen integración con CMS editoriales, plataformas académicas y
marketplaces de libros (filtros "con Sello Liberitas").
Sección 10
Comparativa con Alternativas
Detectores anglocéntricos
| Dimensión |
Detectores anglocéntricos |
Liberitas |
| Modelo base |
Entrenado sobre LLMs antiguos en inglés |
Modelos nativos en español |
| Cohorte de control |
Inglesa moderna |
Clásicos españoles + TFG humanos verificados |
| Humanización adversarial |
Frecuentemente vulnerable |
Corpus de entrenamiento incluye variantes humanizadas |
| Decisión |
Binaria (score 0-1) |
Tri-estado + veto multi-componente |
| Trazabilidad |
Score sin firma |
Audit log inmutable con cadena criptográfica |
| Verificación pública |
No documentada |
Endpoint público por identificador único |
| Apelación |
Procedimiento opaco |
Flujo firmado con SLA de 7 días hábiles |
Detección manual por experto
| Dimensión |
Experto humano |
Liberitas |
| Velocidad |
Horas por manuscrito |
Minutos por manuscrito extenso |
| Reproducibilidad |
Subjetiva |
Determinista, trazada a versión firmada |
| Cobertura |
Lecturas selectivas |
Análisis completo del manuscrito |
| Coste marginal |
Alto |
Bajo |
| Asistencia al juicio |
— |
Informe anotado + heatmap por sección |
Complementariedad
El sistema no sustituye al experto humano: lo complementa
focalizando su atención y aportando un soporte trazable. El override humano
firmado en el log es parte explícita del workflow.
Sección 11
Limitaciones Conocidas
Falsos positivos residuales en literatura clásica
Algunos autores con registro formal denso del español pre-1930 producen scores
elevados incluso post-calibración. Gestión: umbrales de género más permisivos en
literatura y criterio de veto robusto que exige acuerdo de varios segmentos;
revisión humana en casos límite.
Humanización adversarial extrema en textos cortos
Texto IA reescrito pesadamente por humano en obras cortas tiende a caer en
inconcluso. Esto es comportamiento deseado (no
certificar en duda), no un fallo a corregir.
PDFs escaneados sin OCR
El sistema rechaza con error explícito cualquier documento del que se extraigan
menos de un mínimo de palabras. No realizamos OCR.
Cobertura lingüística
El sistema está calibrado para español peninsular y americano
contemporáneos. No está validado para catalán, gallego, euskera ni
para variantes históricas anteriores al siglo XIX.
Modelos generativos futuros
El detector está calibrado contra los LLMs conocidos a la fecha de emisión de cada
sello. Un modelo generativo significativamente distinto podría requerir un
re-entrenamiento. Por eso cada sello incluye la versión del modelo y el timestamp:
la garantía está acotada al estado del arte en el momento del análisis.
Sección 12
Roadmap
Corto plazo
Refinamiento de la calibración por género literario sobre cohortes
ampliadas. Validación de FPR sobre autores contemporáneos consolidados.
Medio plazo
Incorporación de los próximos releases comerciales de LLMs en el pipeline
adversarial de entrenamiento. Procesos automatizados de re-evaluación
contra nuevos modelos generativos.
Largo plazo
Cobertura de variantes regionales del español (peninsular, mexicano,
rioplatense, caribeño, andino). Estudio de viabilidad para portugués
(Brasil y Portugal) y catalán.
Continuo
Publicación periódica de model cards reproducibles por release. Auditorías
externas independientes sobre el registro inmutable.
Sección 13
Glosario
- Accuracy
- Proporción de predicciones correctas sobre el total.
- Audit log
- Registro append-only inmutable de cada decisión, firmado criptográficamente.
- cert_id
- Identificador único de cada decisión emitida por el Sello, verificable
públicamente.
- Decisión tri-estado
humano / inconcluso / IA. El estado
intermedio existe para forzar revisión humana en zona gris.
- FNR (False Negative Rate)
- Proporción de textos IA clasificados como humanos. Medida del riesgo de "se
nos cuela un IA".
- FPR (False Positive Rate)
- Proporción de textos humanos clasificados como IA. Medida del riesgo
reputacional para una editorial.
- Hash-chain SHA-256
- Secuencia de hashes donde cada entrada incluye el hash de la anterior.
Modificar una entrada antigua invalida toda la cadena posterior.
- HMAC-SHA256
- Código de autenticación de mensaje basado en hash, firmado con una clave
secreta. Garantiza autenticidad.
- Humanización
- Técnica adversarial que reescribe texto IA para evadir detectores. Puede ser
light o heavy.
- NPV (Negative Predictive Value)
- Precisión del predictor cuando predice "humano". Métrica crítica para el
Sello: cuando decimos "humano", queremos que lo sea de verdad.
- Veto multi-componente
- Criterio de certificación que exige que todos los análisis
independientes aprueben. Cualquiera puede bloquear.