http://repositorio.usfq.edu.ec/handle/23000/14516
Tipo de material: | bachelorThesis |
Título : | Estructuras matemáticas en modelos de lenguaje |
Autor : | Carrión García, Andrés Nicolás |
Director de Tesis : | Di Teodoro, Antonio, dir. |
Descriptores : | Redes neuronales (Computadores) - Transformadores - Tesis y disertaciones académicas |
Fecha de publicación : | 11-dic-2024 |
Editorial : | Quito, |
Citación : | Tesis (Matemático), Universidad San Francisco de Quito, Colegio de Ciencias e Ingenierías; Quito, Ecuador, 2024 |
Páginas : | 71 h. |
Acceso: | openAccess Atribución-NoComercial-SinDerivadas 3.0 Ecuador |
Resumen : | Este trabajo presenta un análisis detallado del modelo transformer decoder-only. A lo largo del documento, se desglosan los componentes clave del modelo, como los embeddings, la tokenización, la codificación posicional y el mecanismo de atención, desde una perspectiva matemática. Se explica cómo cada uno de estos elementos permite al modelo interpretar y generar lenguaje natural de manera eficiente, preservando tanto la semántica como la estructura del texto... |
Descripción : | This document presents a detailed analysis of the decoder-only transformer model. Throughout the paper, the key components of the model, such as embeddings, tokenization, positional encoding and the attention mechanism, are broken down from a mathematical perspective. It explains how each of these elements allows the model to interpret and generate natural language efficiently, preserving both semantics and text structure... |
URI : | http://repositorio.usfq.edu.ec/handle/23000/14516 |
Aparece en las colecciones: | Tesis - Matemáticas |
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
320261.pdf | Texto completo | 9.93 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons