Los coronavirus: MERS-CoV, SARS-CoV y el SARS-CoV-2 son virus altamente patógenos que causan enfermedades respiratorias graves en humanos. Las interacciones Dominio-motivo entre proteínas son el medio esencial por el cual los virus imitan los procesos biológicos y secuestran la maquinaria de replicación de la célula huésped para sobrevivir. Las interacciones entre proteínas pueden analizarse identificando las expresiones regulares que corresponden con los motivos; en este estudio se realizó minería de datos para mapear interacciones Dominio-motivo en los proteomas de los coronavirus. Se encontró que los motivos expresados en proteínas virales que interactúan con proteínas del huésped se encuentran compartidos y conservados entre los tres coronavirus, indicando que el mimetismo molecular es un mecanismo común en la infección por coronavirus. Además, se realizó un análisis para determinar la ontología de genes, demostrando que los Dominios identificados participan en los procesos relacionados con el uso de fuentes de carbono (proteína N) y regulación de canales de potasio (proteína S). La identificación de estos motivos como potenciales epítopes demostró que en su mayoría estos epítopes se ubican en las proteínas espiga y nucleocápside. Además, estos epítopes se conservan entre los 3 beta coronavirus y son reconocidos por células T CD8+. Este estudio demuestra que la minería de datos enfocada en la identificación de interacciones Dominio-motivo es una estrategia de vacunología reversa interesante para el diseño racional de nuevos tratamientos contra patógenos virales.
Coronaviruses: MERS-CoV, SARS-CoV, and SARS-CoV-2 are highly pathogenic viruses that cause severe respiratory diseases in humans. Although there are therapeutic strategies for these infections, there is still no specific strategy to eliminate them. Domain-motif interactions between proteins are the essential means by which viruses mimic biological processes and hijack the replication machinery of the host cell to survive. Protein interactions can be analyzed by identifying regular expressions that correspond to motifs; in this study, data mining was conducted to map Domain-motif interactions in the coronavirus proteomes. It was found that motifs expressed in viral proteins interacting with host proteins are shared and conserved among the three coronaviruses, indicating that molecular mimicry is a common mechanism in coronavirus infection. Additionally, an analysis was conducted to determine gene ontology, demonstrating that the identified Domains are involved in processes related to the use of carbon sources (N protein) and regulation of potassium channels (S protein). Identifying these motifs as potential epitopes showed that most of these epitopes are located in the spike and nucleocapsid proteins. Furthermore, these epitopes are conserved among the three beta-coronaviruses and are recognized by CD8+ T cells, as indicated by molecular docking analysis of peptides with recurrent class I HLA receptor haplotypes in SARS-CoV-2 infection. Therefore, this study demonstrates that data mining focused on identifying Domain-motif interactions is an interesting reverse vaccinology strategy for the rational design of new treatments against viral pathogens.