GERAÇÃO E PROCESSAMENTO DE BANCOS DE DADOS DE BIOINFORMÁTICA

Autores/as

Resumen

Inserido na interseção entre Bioinformática, Biologia Computacional e saúde pública, este estudo aborda o problema do pré-processamento de dados genômicos. Com a crescente de dados genômicos e expressão gênica, os métodos para a filtragem de dados têm se destacado como uma técnica fundamental para a organização de registros, extrair materiais e desenvolver novas hipóteses de pesquisa. Neste contexto de pesquisa, o objetivo deste trabalho é a geração de um conjunto de dados de expressão gênica, usando técnicas de processamento e tratamento de banco de dados, para o estudo do Alzheimer e também para a classificação de subtipos de câncer de mama. Esse objetivo foi alcançado a partir do uso do Python e de suas respectivas bibliotecas, além do auxílio de repositórios públicos bem conceituados. Foi realizada a elaboração dos dados, por início da extração, fusão, organização das colunas e a normalização. Um dos principais destaques alcançados foi a criação de uma função específica para automatizar o pipeline de preparação dos dados. O resultado prático é um conjunto de bancos de dados coesos e qualificados, que servem como um recurso valioso para a comunidade científica. A validação das etapas demonstrou a eficácia da abordagem e reitera a importância crítica do pré-processamento para a obtenção de resultados confiáveis em Bioinformática.

Publicado

2026-05-07