Use este identificador para citar ou linkar para este item:
https://repositorio.ufc.br/handle/riufc/80611
Tipo: | TCC |
Título: | Percepção sobre requisitos de qualidade de dados para sistemas baseados em aprendizado de máquina: um estudo preliminar |
Autor(es): | Silva, Jessica Maria Nunes da |
Orientador: | Silva, Marcelo Martins da |
Coorientador: | Uchôa, Anderson Gonçalves |
Palavras-chave em português: | aprendizado de máquina;qualidade dos dados;requisitos de qualidade |
CNPq: | CNPQ: CIÊNCIAS EXATAS E DA TERRA |
Data do documento: | 2025 |
Citação: | SILVA, Jessica Maria Nunes da. Percepção sobre requisitos de qualidade de dados para sistemas baseados em aprendizado de máquina: um estudo preliminar. 2025. 60 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025. |
Resumo: | O Aprendizado de Máquina (AM) é uma área da Inteligência Artificial que desenvolve algoritmos capazes de aprender a partir de dados e melhorar seu desempenho com a experiência. Com a crescente adoção de sistemas baseados em AM, a qualidade dos dados utilizados nesses sistemas tornou-se um fator crítico. Essa qualidade está diretamente relacionada aos requisitos não funcionais (RNFs), fundamentais para a eficácia e confiabilidade dos modelos de AM. No entanto, a aplicação de RNFs em sistemas AM ainda apresenta desafios, pois alguns requisitos tornam-se mais críticos, outros mudam de significado e novos podem surgir. Este estudo investigou a percepção dos desenvolvedores sobre os RNFs relacionados à qualidade dos dados em AM, identificando os requisitos mais relevantes, as práticas adotadas para avaliá-los e os desafios enfrentados. A pesquisa foi conduzida por meio de um questionário aplicado a profissionais da área, resultando em uma amostra diversificada de desenvolvedores, cientistas de dados e engenheiros de Machine Learning. Os resultados indicaram que os principais atributos de qualidade dos dados considerados pelos profissionais incluem consistência, precisão, relevância, atualização e confiabilidade. Observouse também que, embora os participantes possuam experiência prática com qualidade de dados, a aplicação de técnicas formais de Engenharia de Requisitos ainda é limitada no contexto de AM. A análise revelou que a qualidade dos dados é frequentemente discutida nas fases iniciais do desenvolvimento, mas sua avaliação contínua ao longo do ciclo de vida do sistema ainda enfrenta dificuldades. Entre os principais desafios identificados, destacam-se a falta de processos padronizados para avaliação da qualidade dos dados, a dificuldade em estabelecer métricas objetivas e a ausência de ferramentas adequadas para a validação contínua. Além disso, a pesquisa evidenciou que muitos profissionais reconhecem a importância dos RNFs para a qualidade dos modelos, mas ainda há lacunas na adoção sistemática dessas práticas no desenvolvimento de sistemas AM. |
Abstract: | Machine Learning (ML) is a field of Artificial Intelligence that develops algorithms capable of learning from data and improving their performance through experience. With the increasing adoption of ML-based systems, data quality has become a critical factor. This quality is directly related to non-functional requirements (NFRs), which are essential for the effectiveness and reliability of ML models. However, applying NFRs in ML systems presents challenges, as some requirements become more critical, others change in meaning, and new ones may emerge. This study investigated developers’ perceptions of NFRs related to data quality in ML, identifying the most relevant requirements, the practices adopted to evaluate them, and the challenges faced. The research was conducted through a survey with professionals in the field, resulting in a diverse sample of developers, data scientists, and machine learning engineers. The results indicate that the main data quality attributes considered by professionals include consistency, accuracy, relevance, timeliness, and reliability. While participants have practical experience with data quality, the use of formal requirements engineering techniques in ML remains limited. The analysis revealed that data quality is often discussed in the early stages of development, but its continuous assessment throughout the system’s lifecycle still faces difficulties. The main challenges identified include the lack of standardized processes for evaluating data quality, difficulty in defining objective metrics, and the absence of adequate tools for continuous validation. Furthermore, the study highlighted that many professionals recognize the importance of NFRs for model quality, but there are still gaps in the systematic adoption of these practices in ML system development. |
URI: | http://repositorio.ufc.br/handle/riufc/80611 |
ORCID do Orientador: | https://orcid.org/0009-0009-7520-6293 |
Currículo Lattes do Orientador: | http://lattes.cnpq.br/4032618135238167 |
ORCID do Coorientador: | https://orcid.org/0000-0002-6847-5569 |
Currículo Lattes do Coorientador: | http://lattes.cnpq.br/3740664626762609 |
Tipo de Acesso: | Acesso Aberto |
Aparece nas coleções: | SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2025_tcc_jmnsilva.pdf | 3,1 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.