CellHeap: um workflow para processamento de grandes volumes de dados de pacientes de COVID-19 no Supercomputador Santos Dumont
Fabricio Alves Barbosa da Silva - Fiocruz
09 de março - 14h
RESUMO
A análise conjunta de grandes volumes de dados é fundamental para a geração de novo conhecimento biológico sobre o comportamento do sistema imune de pacientes graves de COVID-19. Nosso grupo identificou várias centenas de Terabytes de dados de RNA-seq de célula única (scRNA-seq) de pacientes de COVID-19 disponíveis em repositórios públicos até esta data. Esses dados estão relacionados a vários tecidos, comorbidades e condições. Podemos esperar que essa tendência continue, e não é irreal projetar volumes de dados scRNA-seq de pacientes de COVID-19 aumentando para vários petabytes nos próximos meses. No entanto, a análise cuidadosa desses dados requer infraestruturas de computação em larga escala e sistemas de software otimizados para essas plataformas. Esta palestra apresentará o CellHeap, um workflow configurável, portátil e robusto para análises customizáveis de scRNA-seq, com controle de qualidade em todas as etapas de execução, garantindo resultados confiáveis. Será descrita a implantação do CellHeap no supercomputador Santos Dumont (https://sdumont.lncc.br/) para análise de grandes volumes de dados scRNA-seq de pacientes de COVID-19. Além disso, serão apresentados resultados de um estudo de caso que processou dezenas de Terabytes de dados brutos de scRNA-seq de pacientes de COVID-19.
SOBRE O AUTOR
Fabricio Alves Barbosa da Silva é Pesquisador em Saúde Pública da FIOCRUZ (Fundação Oswaldo Cruz), líder do grupo de pesquisa em Modelagem Computacional de Bactérias Multirresistentes. Ele tem um Ph.D. pela Université Pierre et Marie Curie (Paris VI) e foi professor visitante na Universidade da Califórnia - Irvine e na Universidade de Lisboa. Publicou mais de 100 trabalhos científicos e editou dois livros sobre Biologia de Sistemas na série Computational Biology da Springer Nature. Coordenador de um projeto INOVA-FIOCRUZ sobre Biologia de Sistemas da COVID-19.
ANEXO