Tecnologías de la Información

PJ – TI – 186 Detector de correos de SPAM con Inteligencia Artificial

Educación de calidad
Industria, innovación e infraestructura
Paz, justicia e instituciones sólidas

Asesor: Enriqueta Sandoval

Instituci: Centro Escolar ZAMA

Pandilla Juvenil (1ro. 2do. y 3ro. de nivel Secundaria)

Victor Ivan Hidalgo Resendiz[1o Tulum], Emilio Sebastian Lopez Hernandez[1o Tulum], Iktan Itzae Marquez Alargon[1o Tulum]

Tiene como finalidad el desarrollo de un detector de correos electrónicos de SPAM mediante el uso de Inteligencia Artificial y el lenguaje de programación Python. El objetivo principal es diseñar un sistema capaz de identificar y clasificar automáticamente mensajes no deseados o potencialmente peligrosos, tales como publicidad engañosa, promociones falsas o intentos de fraude, con el propósito de fortalecer la seguridad digital de los usuarios de Gmail. Se basa en el aprendizaje supervisado, técnica en la cual un modelo informático es entrenado a partir de ejemplos previamente etiquetados como “spam” o “no spam”. Este enfoque permite que el sistema aprenda patrones presentes en los correos electrónicos y sea capaz de reconocerlos posteriormente en nuevos mensajes. Para su implementación se utilizó una computadora con sistema operativo Microsoft Windows, el entorno de programación Python y diversas librerías especializadas en análisis de datos y procesamiento de texto.

Inicialmente, se preparó un conjunto de 100 correos electrónicos en español que sirvieron como base de entrenamiento. Posteriormente, los textos fueron procesados para identificar patrones lingüísticos relevantes, como palabras frecuentes, expresiones repetitivas o estructuras comunes presentes en mensajes no deseados. Una vez entrenado, el modelo fue almacenado para su reutilización y se desarrolló una interfaz interactiva mediante la app Streamlit, que permite al usuario ingresar el contenido de un correo y obtener una clasificación automática junto con una probabilidad estimada. Lo que obtuvimos demostró que es posible aplicar herramientas de inteligencia artificial a pequeña escala para resolver problemas reales relacionados con la seguridad en la comunicación digital y mejorar la protección de la información personal, especialmente frente a fraudes y engaños en línea.

The project aims to develop a spam email detector using Artificial Intelligence and the programming language Python. Its main objective is to design a system capable of automatically identifying and classifying unwanted or potentially harmful messages, such as deceptive advertising, fake promotions, or fraud attempts, with the goal of enhancing the digital security of Gmail users.

The project is based on supervised learning, a technique in which a computer model is trained using examples previously labeled as “spam” or “not spam.” This approach allows the system to learn patterns present in emails and recognize them in new messages. For its implementation, a computer with Microsoft Windows operating system was used, along with the Python programming environment and various specialized libraries for data analysis and text processing.

Initially, a dataset of 100 emails in Spanish was prepared to serve as the training base. Subsequently, the texts were processed to identify relevant linguistic patterns, such as frequent words, repeated expressions, or common structures found in unwanted messages.

Once trained, the model was stored for reuse, and an interactive interface was developed using Streamlit, allowing users to input the content of an email and obtain an automatic classification along with an estimated probability.

The results demonstrate that it is possible to apply artificial intelligence tools on a small scale to solve real problems related to digital communication security and improve the protection of personal information, especially against online fraud and deceptive messages.

Inin tlamachtiliztli quipiya in tlatequipanolli se detector tlen correos electrónicos SPAM ika inteligencia artificial ihuan tlajtolli programación Python. In sistema omomachti ika aprendizaje supervisado ika 100 correos español tlen achto omotlatlali “spam” o “amo spam”. Ika procesamiento de texto, in modelo omomachtia quimati patrones tlen moneki ipan correos amo cuali. Satepan omochi se aplicación interactiva ika Streamlit tlen kualtia clasificar yancuic correos ihuan temaka se probabilidad. In resultados quitemoa tlatskaniliztli tlen inteligencia artificial hueli palehui ipan seguridad digital.

El correo electrónico es una herramienta esencial para comunicarnos, pero también presenta problemas como el spam, que incluye mensajes engañosos y enlaces sospechosos, por lo que es importante proteger nuestra información.

La inteligencia artificial permite a las computadoras aprender de ejemplos, analizar patrones y mejorar con la práctica, lo que hace posible crear un detector de spam que identifique automáticamente correos no deseados, como ocurre en servicios como Gmail.

Nosotros buscamos desarrollar un detector de spam en español entrenado con correos reales clasificados, combinando programación, análisis de datos y aprendizaje automático. Además de su función técnica, tiene un propósito educativo: comprender cómo funciona la inteligencia artificial, trabajar con datos reales y promover la seguridad digital para lograr una comunicación más segura y eficiente

 

En la actualidad, el uso del correo electrónico se ha convertido en una herramienta fundamental para la comunicación académica, laboral y personal. Sin embargo, el incremento de correos no deseados, conocidos como spam, representa un problema constante, ya que estos mensajes pueden contener publicidad engañosa, intentos de fraude o enlaces maliciosos que ponen en riesgo la seguridad de la información de los usuarios.

Ante esta situación, surge la necesidad de desarrollar un detector de correos spam utilizando Inteligencia Artificial, el cual permita identificar y clasificar automáticamente los mensajes no deseados. La aplicación de técnicas de IA hace posible analizar grandes volúmenes de datos, reconocer patrones en el contenido de los correos y mejorar continuamente la precisión del sistema conforme se expone a nuevos ejemplos.

Se puede mejorar la seguridad digital, reduciendo el tiempo que los usuarios dedican a revisar correos irrelevantes y prevenir posibles amenazas informáticas.

Muchos estudiantes y usuarios en general no cuentan con herramientas claras para identificar cuáles correos son seguros y cuáles no lo son. Esto puede ocasionar que se eliminen correos importantes por error o que se abran mensajes que podrían causar molestias, confusión o riesgos digitales. Además, algunos de estos mensajes forman parte de intentos de fraude conocidos como Phishing, en los cuales los atacantes se hacen pasar por empresas, bancos o servicios conocidos para engañar a los usuarios y obtener información personal.

Cuando una persona proporciona sus datos en estos correos falsos, los delincuentes pueden acceder a cuentas personales, contraseñas e incluso a información bancaria. Esto puede derivar en robos de dinero, transferencias no autorizadas o compras fraudulentas, afectando la economía de las víctimas. Instituciones como el Federal Bureau of Investigation han advertido que el fraude por correo electrónico es una de las formas de ciberdelito más comunes y que provoca pérdidas económicas significativas cada año en todo el mundo

Si logramos desarrollar un detector de SPAM con IA entonces mantendremos la seguridad de los usuarios de Gmail.

Desarrollar un detector básico de correos electrónicos spam utilizando principios sencillos de inteligencia artificial, con el fin de identificar y clasificar mensajes no deseados de manera automática. Además de proteger a los usuarios de Gmail usando una inteligencia artificial entrenada para detectar características de los correos de SPAM por medio de Python

Desarrollar un detector de SPAM con Inteligencia Artificial.

ODS 4: Educación de calidad

Fomentar el aprendizaje de nuevas tecnologías como la inteligencia artificial en estudiantes, desarrollando habilidades digitales, pensamiento crítico y resolución de problemas.

ODS 9: Industria, innovación e infraestructura

Promover el uso de la innovación tecnológica mediante el desarrollo de soluciones digitales sencillas que mejoren los servicios de comunicación.

ODS 16: Paz, justicia e instituciones sólidas

Contribuir a la seguridad digital ayudando a prevenir fraudes, engaños y desinformación a través de la detección de correos electrónicos no deseados.

El correo electrónico es una de las herramientas de comunicación más utilizadas en la actualidad. Gracias a su rapidez y facilidad de uso, se ha convertido en un medio fundamental en distintos ámbitos, como la educación, el trabajo y la vida cotidiana. A través del correo electrónico es posible enviar mensajes, documentos y archivos importantes de manera inmediata, lo que facilita la comunicación entre personas que se encuentran en diferentes lugares.

Sin embargo, junto con el uso creciente del correo electrónico, también ha surgido un problema importante conocido como spam. El spam consiste en mensajes enviados sin el consentimiento del receptor, los cuales generalmente no tienen utilidad para quien los recibe. Estos correos suelen incluir publicidad no deseada, promociones falsas, anuncios engañosos o intentos de fraude. En muchos casos, su objetivo es llamar la atención del usuario para que realice alguna acción que puede poner en riesgo su información personal.

El spam no solo resulta molesto, sino que también puede representar un peligro para la seguridad digital. Algunos correos no deseados contienen enlaces a páginas falsas o archivos que pueden dañar los dispositivos electrónicos. Otros mensajes buscan engañar a las personas para que compartan datos personales, como contraseñas o información bancaria. Por estas razones, el spam se considera un problema serio que afecta a millones de usuarios en todo el mundo.

En los primeros años del uso del correo electrónico, no existían herramientas automáticas para identificar y bloquear el spam. Los usuarios debían revisar manualmente todos los mensajes que recibían y eliminar aquellos que no eran importantes. Este proceso era lento y poco eficiente, ya que algunos correos de spam podían parecer legítimos y pasar desapercibidos. A medida que aumentó el número de usuarios de correo electrónico, esta situación se volvió cada vez más complicada.

Con el tiempo, se desarrollaron métodos básicos para reducir la cantidad de spam. Uno de estos métodos consistía en bloquear direcciones de correo electrónico que enviaban mensajes repetitivos. Otro método se basaba en filtrar correos que contenían ciertas palabras clave comúnmente utilizadas en el spam. Aunque estas técnicas ayudaron a disminuir el problema, no eran completamente efectivas, ya que los emisores de spam modificaban constantemente el contenido de sus mensajes.

Posteriormente, se crearon sistemas más avanzados conocidos como filtros de correo electrónico. Estos filtros analizaron el contenido de los mensajes y utilizaban técnicas estadísticas para identificar patrones comunes en los correos no deseados. Gracias a estos sistemas, fue posible mejorar la detección del spam y reducir la cantidad de mensajes no deseados que llegaban a la bandeja de entrada de los usuarios.

En años más recientes, se incorporaron la inteligencia artificial y el aprendizaje automático en los sistemas de filtrado de correo electrónico. Estas tecnologías permiten que las computadoras aprendan a partir de grandes cantidades de información y mejoren su funcionamiento con el tiempo. Los filtros actuales pueden analizar no sólo las palabras de un mensaje, sino también su estructura, el comportamiento del remitente y otros factores importantes.

Actualmente, las principales empresas de tecnología utilizan modelos de inteligencia artificial para proteger a millones de usuarios del spam. Estos sistemas clasifican los correos de manera automática y separan los mensajes importantes de los no deseados. Gracias a estos avances, la mayoría de los usuarios recibe menos spam y puede utilizar el correo electrónico de forma más segura y eficiente.

A pesar de los avances tecnológicos, el spam sigue existiendo. Por ello, también es importante que los usuarios adopten hábitos responsables, como no abrir correos sospechosos, no descargar archivos desconocidos y no compartir información personal por correo electrónico. Estas acciones ayudan a reducir los riesgos asociados al spam.

En conclusión, el correo electrónico es una herramienta esencial en la sociedad actual, pero su uso ha generado problemas como el spam. A lo largo del tiempo, se han desarrollado diferentes métodos para combatir este problema, desde técnicas simples hasta sistemas avanzados basados en inteligencia artificial. Gracias a estos esfuerzos, el uso del correo electrónico es hoy más seguro, aunque sigue siendo necesario mantener precauciones para evitar posibles riesgos.

Como se ha mencionado anteriormente, el correo electrónico es una herramienta esencial en la comunicación actual, ya que permite intercambiar información de manera rápida y eficiente. Su uso se ha integrado en actividades escolares, laborales y personales, convirtiéndose en un medio cotidiano para enviar tareas, documentos y avisos importantes. Gracias a su facilidad de acceso, millones de personas utilizan servicios de correo electrónico como Gmail para mantenerse comunicadas, lo que demuestra su relevancia en la vida moderna.

Sin embargo, el crecimiento del correo electrónico también trajo consigo nuevos desafíos. A medida que aumentó el número de usuarios, comenzaron a aparecer mensajes enviados sin autorización, conocidos como spam. Estos correos no deseados suelen incluir publicidad engañosa, promociones falsas o mensajes diseñados para captar la atención del receptor. En algunos casos, su propósito es inducir al usuario a compartir información personal o acceder a enlaces poco confiables, lo que representa un riesgo para la seguridad digital.

Durante los primeros años del correo electrónico, no existían herramientas eficaces para identificar este tipo de mensajes. Los usuarios debían revisar manualmente su bandeja de entrada, lo que resultaba lento e ineficiente. Además, algunos correos de spam imitaban el formato de mensajes legítimos, dificultando su detección. Esta situación impulsó la necesidad de desarrollar soluciones tecnológicas que ayudarán a filtrar automáticamente los mensajes sospechosos.

Con el avance de la tecnología, surgieron métodos más estructurados para combatir el spam. Inicialmente se aplicaron filtros simples basados en palabras clave o en el bloqueo de direcciones específicas. Aunque estos sistemas lograron reducir parte del problema, no eran completamente efectivos, ya que los emisores de spam adaptan constantemente sus estrategias. Esto llevó al desarrollo de técnicas más avanzadas capaces de analizar patrones dentro de los mensajes.

Posteriormente, la incorporación de la inteligencia artificial marcó un cambio importante en la detección de correos no deseados. Estos sistemas pueden aprender a partir de ejemplos reales y mejorar su precisión con el tiempo. Al analizar el contenido de los mensajes, su estructura y otros factores relevantes, los filtros modernos logran clasificar los correos con mayor exactitud. Gracias a estos avances, el uso del correo electrónico se ha vuelto más seguro y organizado.

A pesar de los progresos tecnológicos, el spam continúa evolucionando, lo que hace necesario mantener tanto herramientas inteligentes como hábitos responsables por parte de los usuarios. Comprender estos antecedentes permite valorar la importancia de aplicar soluciones basadas en inteligencia artificial para proteger la comunicación digital y mejorar la experiencia de quienes utilizan el correo electrónico en su vida diaria.

El correo electrónico es una de las herramientas de comunicación más utilizadas en la actualidad. Gracias a su rapidez y facilidad de uso, se ha convertido en un medio fundamental en distintos ámbitos, como la educación, el trabajo y la vida cotidiana. A través del correo electrónico es posible enviar mensajes, documentos y archivos importantes de manera inmediata, lo que facilita la comunicación entre personas que se encuentran en diferentes lugares.

Sin embargo, junto con el uso creciente del correo electrónico, también ha surgido un problema importante conocido como spam. El spam consiste en mensajes enviados sin el consentimiento del receptor, los cuales generalmente no tienen utilidad para quien los recibe. Estos correos suelen incluir publicidad no deseada, promociones falsas, anuncios engañosos o intentos de fraude, y en muchos casos buscan que el usuario realice acciones que pueden poner en riesgo su información personal.

El spam no solo resulta molesto, sino que también representa un peligro para la seguridad digital. Algunos correos contienen enlaces a páginas falsas o archivos dañinos, mientras que otros intentan obtener datos personales como contraseñas o información bancaria. En los primeros años del uso del correo electrónico, no existían herramientas automáticas para identificar estos mensajes, por lo que los usuarios debían revisarlos y eliminarlos manualmente, lo cual era un proceso lento e ineficiente.

Con el paso del tiempo, se desarrollaron métodos básicos para reducir el spam, como el bloqueo de direcciones sospechosas y el uso de palabras clave. Posteriormente, surgieron filtros más avanzados que analizan patrones en los mensajes mediante técnicas estadísticas. En años recientes, la inteligencia artificial ha permitido crear sistemas más eficientes que aprenden de grandes cantidades de información y mejoran su capacidad para clasificar correos electrónicos.

Además de su aplicación tecnológica, la detección de spam se ha convertido en un tema relevante en el ámbito educativo. Proyectos escolares relacionados con este problema permiten que los estudiantes comprendan cómo funcionan las tecnologías que utilizan diariamente y cómo estas pueden aplicarse para resolver situaciones reales. Desarrollar un detector de spam a pequeña escala ayuda a fomentar el pensamiento lógico, el análisis de información y el uso responsable de la tecnología.

Origen histórico del spam en los medios digitales

El problema del spam no comenzó con el correo electrónico moderno, sino que tiene antecedentes en los primeros sistemas de comunicación digital. En la década de 1970, cuando se utilizaba la red experimental ARPANET (antecesora de Internet), se registraron los primeros envíos masivos de mensajes con fines publicitarios. Estos envíos no solicitados marcaron el inicio de una práctica que posteriormente se extendió a gran escala con el crecimiento de Internet en los años noventa.

Con la popularización de la red mundial y la creación de servicios de correo electrónico gratuitos, el envío masivo de mensajes se volvió más sencillo y económico. Esto permitió que empresas poco éticas y personas con intenciones fraudulentas aprovechan la facilidad tecnológica para distribuir publicidad engañosa o intentar estafas digitales. Así, el spam evolucionó al mismo ritmo que la infraestructura de Internet.

Evolución de las estrategias utilizadas por los emisores de spam

A lo largo del tiempo, quienes envían spam han perfeccionado sus métodos para evitar ser detectados. En un inicio, los mensajes eran fácilmente identificables por su contenido repetitivo y evidente carácter publicitario. Sin embargo, con la implementación de filtros automáticos, los emisores comenzaron a modificar palabras, incluir símbolos, cambiar formatos y utilizar imágenes en lugar de texto para evadir los sistemas de detección.

Posteriormente surgieron técnicas más sofisticadas, como el uso de redes de computadoras infectadas (conocidas como “botnets”), que permiten enviar grandes cantidades de correos desde múltiples ubicaciones distintas. Esto dificulta identificar el origen real del mensaje y representa un reto adicional para los sistemas de seguridad.

Desarrollo de técnicas estadísticas en la detección de spam

Antes de la aplicación de modelos avanzados de inteligencia artificial, se emplearon métodos matemáticos basados en probabilidades. Uno de los enfrentes más importantes fue el uso de clasificadores bayesianos, que calculan la probabilidad de que un mensaje sea spam según las palabras que contiene y su frecuencia de aparición.

Estos métodos representaron un avance significativo porque permitían una clasificación más flexible que los simples filtros por palabras clave. En lugar de bloquear únicamente términos específicos, el sistema analizaba combinaciones y patrones, lo que mejoró considerablemente la precisión del filtrado.

Incorporación del aprendizaje automático moderno

Con el avance de la capacidad de procesamiento de las computadoras y el crecimiento del almacenamiento de datos, fue posible entrenar modelos más complejos. El aprendizaje automático permitió que los sistemas analizaran grandes volúmenes de correos electrónicos reales para identificar características comunes entre mensajes legítimos y no deseados.

Actualmente se emplean técnicas como redes neuronales artificiales y modelos de procesamiento de lenguaje natural, los cuales no solo revisan palabras individuales, sino que interpretan el contexto del mensaje. Esto significa que el sistema puede reconocer intenciones sospechosas incluso cuando el texto no contiene términos típicamente asociados al spam.

Regulación y medidas legales contra el spam

Además de las soluciones tecnológicas, diversos países han establecido leyes para regular el envío de mensajes electrónicos comerciales. Estas normativas obligan a las empresas a obtener el consentimiento del usuario antes de enviar publicidad y a ofrecer mecanismos claros para cancelar la suscripción.

Aunque la legislación ha ayudado a disminuir ciertas prácticas abusivas, el carácter global de Internet dificulta la aplicación uniforme de estas medidas, ya que muchos emisores operan desde distintos países.

Impacto del spam en la sociedad digital

El spam no solo representa un inconveniente individual, sino también un problema a nivel global. El envío masivo de correos electrónicos consume recursos de almacenamiento, ancho de banda y energía eléctrica en servidores de todo el mundo. Esto implica costos económicos y ambientales adicionales.

Asimismo, el aumento de ataques de phishing y fraudes digitales ha generado la necesidad de fortalecer la educación en ciberseguridad. Las instituciones educativas y las empresas tecnológicas han impulsado programas para concientizar a los usuarios sobre los riesgos asociados a los mensajes sospechosos.

Tendencias actuales y futuro de la detección de spam

En la actualidad, la detección de spam continúa evolucionando. Los sistemas más recientes combinan inteligencia artificial con análisis de comportamiento en tiempo real. Esto permite identificar patrones inusuales en el envío de mensajes y reaccionar rápidamente ante nuevas amenazas.

Sin embargo, el desarrollo de tecnologías como la inteligencia artificial generativa también plantea nuevos desafíos, ya que facilita la creación de mensajes más convincentes y difíciles de distinguir de los legítimos. Por esta razón, la investigación en este campo sigue siendo activa y relevante.

Aunque el spam sigue existiendo, los avances tecnológicos han permitido reducir su impacto. Al mismo tiempo, abordar este tema desde la educación contribuye a formar usuarios más conscientes y preparados para enfrentar los riesgos del entorno digital.

 

Materiales:

1 computadora o laptop con acceso a internet.

Sistema operativo Windows

Lenguaje de programación Python.

Editor de código, en nuestro caso notepad.

Librerías de Python:pandas (para trabajar con datos).

scikit-learn (para crear el modelo de inteligencia artificial).

nltk (para trabajar con el lenguaje español).

joblib (para guardar el modelo entrenado).

streamlit (para crear una interfaz.

Procedimiento:

1.- Abre una terminal: En la opción de búsqueda de Windows teclear cmd; se

observará un programa que dice "Símbolo del sistema", dar doble click y se abrirá

una pantalla negra con algo que se conoce como prompt.

2.-Para instalar Python es necesario ejecutar la siguiente instrucción en la terminal que abrimos en el paso anterior.

winget install Python.Python.3

3.-Al ejecutar la siguiente instrucción debe aparecer en la pantalla la versión de

Python instalada.

python –version

4.-Ejecuta la siguiente instrucción para instalar pip desde la terminal.

python -m pip install –upgrade pip

5.-Instalar las librerías ejecutando cada una de estas instrucciones en la terminal (se debe ejecutar línea por línea)

python -m pip install pandas

python -m pip install scikit-learn

python -m pip install nltk

python -m pip install joblib

python -m pip install streamlit

6.-Crear una carpeta con el nombre “detector_spam_ia” en el directorio de su preferencia.

7.-Crear el archivo de entrenamiento:

  1. a) Abre Notepad.
  2. b) En tu carpeta guarda un archivo llamado “entrenar_detector_spam.py”,

este archivo servirá para enseñar a la computadora a reconocer correos spam.

8.-Copia exactamente este código dentro del archivo entrenar_detector_spam.py y guardarlo.

import pandas as pd

import re

import nltk

import joblib

nltk.download('stopwords')

from nltk.corpus import stopwords

 

def limpiar_texto(texto):

texto = texto.lower()

texto = re.sub(r"http\S+", " ", texto)

texto = re.sub(r"[^a-záéíóúñü0-9\s]", " ", texto)

texto = re.sub(r"\s+", " ", texto).strip()

return texto

 

print("Cargando dataset…")

df = pd.read_csv("spam_ham_es.csv")

 

df["texto_limpio"] = df["text"].apply(limpiar_texto)

X = df["texto_limpio"]

y = df["label"].map({"ham": 0, "spam": 1})

 

X_train, X_test, y_train, y_test = train_test_split(

X, y, test_size=0.25, random_state=42

)

 

pipeline = Pipeline([

("tfidf", TfidfVectorizer(stop_words=stopwords.words("spanish"))),

("modelo", MultinomialNB())

])

 

print("Entrenando modelo…")

pipeline.fit(X_train, y_train)

 

print("Evaluando modelo…")

y_pred = pipeline.predict(X_test)

print(classification_report(y_test, y_pred))

 

joblib.dump(pipeline, "modelo_spam_es.joblib")

print("Modelo guardado correctamente")

 

from sklearn.model_selection import train_test_split

from sklearn.feature_extraction.text import TfidfVectorizer

from sklearn.naive_bayes import MultinomialNB

from sklearn.pipeline import Pipeline

 

from sklearn.metrics import classification_report

9.-Ejecutar el entrenamiento del modelo:

  1. a) Abre el Símbolo del sistema (cmd), entrar a la carpeta debes ejecutar

algo como esto:

cd /[carpeta]/ detector_spam_ia

  1. b) Entra a la carpeta del proyecto y ejecuta

python entrenar_detector_spam.py

  1. c) Verificar resultados

Si todo funciona correctamente, verás mensajes como:

“Cargando dataset…”

“Entrenando modelo…”

Resultados del modelo

“Modelo guardado correctamente”

10.- Crear la aplicación con Streamlit para probar correos

  1. a) Abre Notepad.
  2. b) Guarda un archivo con el nombre exacto “app_spam_es.py”, este archivo

contendrá la aplicación con interfaz gráfica

  1. c) Código completo de la aplicación

Copia todo este código dentro del archivo que acabamos de crear

“app_spam_es.py” y guarda el archivo.

import streamlit as st

import joblib

# Título de la aplicación

st.title("�� Detector de Spam con Inteligencia Artificial")

st.write("Escribe el texto de un correo electrónico y el sistema indicará si es

SPAM o NO SPAM.")

# Cargar el modelo entrenado

modelo = joblib.load("modelo_spam_es.joblib")

# Caja de texto para el correo

texto_correo = st.text_area(

"Texto del correo electrónico:",

height=200,

 

placeholder="Escribe o pega aquí el texto del correo…"

)

# Botón para analizar

if st.button("Analizar correo"):

if texto_correo.strip() == "":

st.warning("Por favor, escribe un correo para analizar.")

else:

prediccion = modelo.predict([texto_correo])[0]

probabilidad = modelo.predict_proba([texto_correo])[0][1]

if prediccion == 1:

st.error(f"�� Resultado: SPAM\n\nProbabilidad de spam:

{probabilidad:.2f}")

else:

st.success(f"✅ Resultado: NO SPAM\n\nProbabilidad de spam:

{probabilidad:.2f}")

11.-Ejecutar la aplicación

Abre el Símbolo del sistema (cmd) y ejecuta el siguiente comando

python -m streamlit run app_spam_es.py

Después,  presionar Enter:

Streamlit terminará de iniciar.

Se abrirá automáticamente el navegador.

Verás tu aplicación:

“Detector de Spam con Inteligencia Artificial”

Obtuvimos un detector de SPAM que utiliza inteligencia artificial y que se puede emplear en Gmail e incluso Whatsapp.

También conseguimos un modelo de inteligencia artificial entrenado con 100 ejemplos de correos de SPAM y HAM, perfectamente funcional.

Se obtuvo un detector de correos spam utilizando inteligencia artificial, lo que permitió comprender cómo la tecnología puede ayudarnos a resolver problemas de la vida diaria. A través del análisis de correos electrónicos, el sistema aprendió a identificar cuáles mensajes son seguros y cuáles pueden ser spam o peligrosos.

Se aprendieron conceptos importantes como el uso de datos, el entrenamiento de un modelo y la importancia de reconocer patrones en la información. También se comprendió que la inteligencia artificial no “piensa sola”, sino que necesita ejemplos y reglas para funcionar correctamente.

Esto demuestra que la inteligencia artificial puede ser una herramienta muy útil para mejorar la seguridad en el uso del correo electrónico y evitar fraudes o mensajes no deseados. Además, permitió reforzar habilidades como el pensamiento lógico, la investigación y la resolución de problemas.

Naciones Unidas. (2015). Transformar nuestro mundo: la Agenda 2030 para el Desarrollo Sostenible. Naciones Unidas.

Google. (s. f.). Cómo funciona el filtro de spam en Gmail. Google.

Instituto Nacional de Ciberseguridad. (s. f.). Recomendaciones para el uso seguro del correo electrónico. INCIBE.

IBM. (s. f.). ¿Qué es la inteligencia artificial? IBM.

Khan Academy. (s. f.). Introducción a la informática y la inteligencia artificial. Khan Academy.

 

SPAM Email Detection Using Mahing Learning Techniques (Adreatos, 2023)

 

Detecting SPAM Emails Using Tensor Flow in Python (Geeks for Geeks)

 

Overview of Machine Learning for Solving the SPAM (Yuldasheva, 2024)

 

Building an Email SPAM detection System (Titus Gitari)

 

Machine-Learning-Based SPAM Mail Detector (2023)

 

Tan, Ying. Anti-Spam Techniques Based on Artificial Immune System. CRC Press, 2016.
– Introduce técnicas de filtrado de correo no deseado basadas en sistemas inmunes artificiales, con modelos y algoritmos aplicados a spam.

 

Rajalingam, Mallikka. Text Segmentation and Recognition for Enhanced Image Spam Detection: An Integrated Approach. Springer, 2021.
– Propone métodos que combinan segmentación y reconocimiento de texto para detectar spam incluso cuando está en imágenes, usando clasificación automática.

 

Tsourakis, Nikos. Machine Learning Techniques for Text (incluye capítulo “Detecting Spam Emails”). Packt Publishing, 2022.
– Contiene capítulos específicos sobre cómo desarrollar e implementar detectores de spam usando aprendizaje automático y técnicas de NLP (preprocesamiento, características, clasificación).

 

Parisi, Alessandro. Hands-On Artificial Intelligence for Cybersecurity (capítulo “Ham or Spam? Detecting Email Cybersecurity Threats with AI”). Packt Publishing, 2019.
– Libro de IA aplicada a ciberseguridad que incluye estrategias de detección automática de spam con algoritmos como Naive Bayes, SVM y NLP.

 

(Relacionado general de IA) Russell, Stuart J. and Peter Norvig. Artificial Intelligence: A Modern Approach. 4ª ed., Prentice Hall, 2020.
– Texto universal sobre IA y técnicas de aprendizaje automático que son base para entender cómo construir sistemas de detección de spam modernos.