Use este identificador para citar ou linkar para este item: https://repositorio.ufc.br/handle/riufc/80611
Tipo: TCC
Título: Percepção sobre requisitos de qualidade de dados para sistemas baseados em aprendizado de máquina: um estudo preliminar
Autor(es): Silva, Jessica Maria Nunes da
Orientador: Silva, Marcelo Martins da
Coorientador: Uchôa, Anderson Gonçalves
Palavras-chave em português: aprendizado de máquina;qualidade dos dados;requisitos de qualidade
CNPq: CNPQ: CIÊNCIAS EXATAS E DA TERRA
Data do documento: 2025
Citação: SILVA, Jessica Maria Nunes da. Percepção sobre requisitos de qualidade de dados para sistemas baseados em aprendizado de máquina: um estudo preliminar. 2025. 60 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025.
Resumo: O Aprendizado de Máquina (AM) é uma área da Inteligência Artificial que desenvolve algoritmos capazes de aprender a partir de dados e melhorar seu desempenho com a experiência. Com a crescente adoção de sistemas baseados em AM, a qualidade dos dados utilizados nesses sistemas tornou-se um fator crítico. Essa qualidade está diretamente relacionada aos requisitos não funcionais (RNFs), fundamentais para a eficácia e confiabilidade dos modelos de AM. No entanto, a aplicação de RNFs em sistemas AM ainda apresenta desafios, pois alguns requisitos tornam-se mais críticos, outros mudam de significado e novos podem surgir. Este estudo investigou a percepção dos desenvolvedores sobre os RNFs relacionados à qualidade dos dados em AM, identificando os requisitos mais relevantes, as práticas adotadas para avaliá-los e os desafios enfrentados. A pesquisa foi conduzida por meio de um questionário aplicado a profissionais da área, resultando em uma amostra diversificada de desenvolvedores, cientistas de dados e engenheiros de Machine Learning. Os resultados indicaram que os principais atributos de qualidade dos dados considerados pelos profissionais incluem consistência, precisão, relevância, atualização e confiabilidade. Observouse também que, embora os participantes possuam experiência prática com qualidade de dados, a aplicação de técnicas formais de Engenharia de Requisitos ainda é limitada no contexto de AM. A análise revelou que a qualidade dos dados é frequentemente discutida nas fases iniciais do desenvolvimento, mas sua avaliação contínua ao longo do ciclo de vida do sistema ainda enfrenta dificuldades. Entre os principais desafios identificados, destacam-se a falta de processos padronizados para avaliação da qualidade dos dados, a dificuldade em estabelecer métricas objetivas e a ausência de ferramentas adequadas para a validação contínua. Além disso, a pesquisa evidenciou que muitos profissionais reconhecem a importância dos RNFs para a qualidade dos modelos, mas ainda há lacunas na adoção sistemática dessas práticas no desenvolvimento de sistemas AM.
Abstract: Machine Learning (ML) is a field of Artificial Intelligence that develops algorithms capable of learning from data and improving their performance through experience. With the increasing adoption of ML-based systems, data quality has become a critical factor. This quality is directly related to non-functional requirements (NFRs), which are essential for the effectiveness and reliability of ML models. However, applying NFRs in ML systems presents challenges, as some requirements become more critical, others change in meaning, and new ones may emerge. This study investigated developers’ perceptions of NFRs related to data quality in ML, identifying the most relevant requirements, the practices adopted to evaluate them, and the challenges faced. The research was conducted through a survey with professionals in the field, resulting in a diverse sample of developers, data scientists, and machine learning engineers. The results indicate that the main data quality attributes considered by professionals include consistency, accuracy, relevance, timeliness, and reliability. While participants have practical experience with data quality, the use of formal requirements engineering techniques in ML remains limited. The analysis revealed that data quality is often discussed in the early stages of development, but its continuous assessment throughout the system’s lifecycle still faces difficulties. The main challenges identified include the lack of standardized processes for evaluating data quality, difficulty in defining objective metrics, and the absence of adequate tools for continuous validation. Furthermore, the study highlighted that many professionals recognize the importance of NFRs for model quality, but there are still gaps in the systematic adoption of these practices in ML system development.
URI: http://repositorio.ufc.br/handle/riufc/80611
ORCID do Orientador: https://orcid.org/0009-0009-7520-6293
Currículo Lattes do Orientador: http://lattes.cnpq.br/4032618135238167
ORCID do Coorientador: https://orcid.org/0000-0002-6847-5569
Currículo Lattes do Coorientador: http://lattes.cnpq.br/3740664626762609
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tcc_jmnsilva.pdf3,1 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.