The gene expression control is a fundamental process in cellular activities, performed through th... more The gene expression control is a fundamental process in cellular activities, performed through the interaction of multiple regulatory mechanisms. The proper regulation of transcription is crucial for a single-cell prokaryote since its environment can change dramatically and instantly. The promoters are recognized as one of the transcription regulatory regions, since recruit the transcriptional machinery through the binding of regulatory proteins in their DNA sequences. The characterizing promoter regions in silico has difficulties, since these elements are short and degenerated, providing a high probability of finding similar sequences in other parts of the genome. Therefore, the embedding of structural characteristics can increase the accuracy of prediction methods [1-2]. In bacteria, RNApolymerase holoenzyme is responsible for promoter recognition and the gene expression starts. This enzyme consists of five subunits (2α, β, β', ω) and an additional sigma (σ) subunit factor. A collection of different σ subunits act as key regulators of bacterial gene expression. The substitution of one σ factor by another can initiate the transcription of different groups of genes [3]. A promoter sequence is characterized by the presence of two conserved DNA elements called-10 and-35 (upstream). These elements are defined according to the distance which have in relation to the transcriptional start site (position 1) and are represented by TATAAT-TTGACA nucleotides [4]. The upstream region (promoter) has distinct sequence properties compared to downstream region (non-promoter), such as differences in the structural characteristics of flexibility, stability and curvature [5]. Artificial neural networks (ANNs) have been widely used in nucleic acid sequences analysis, since they present ability to recognize and classify quantitative and qualitative patterns in data analysis [6]. This work aims to predict, recognize and characterize promoter regions recognized by sigma factor 28 (σ28) employing an approach of artificial neural networks using as input parameter curvature and flexibility data of the sequence.
A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resp... more A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resposta adequada destes organismos as mudancas ambientais. Neste processo, a especificidade da expressao dos genes se da por meio da ligacao do fator σ na enzima RNA polimerase, e o posterior reconhecimento do promotor. O objetivo deste trabalho foi analisar a composicao das sequencias promotoras reconhecidas pelo fator σ 28 (relacionado com mobilidade e patogenicidade bacteriana) e a relacao proteina-proteina dos produtos biologicos associados a estas sequencias. Os promotores de Escherichia coli foram agrupados utilizando a tecnica de mineracao de dados denominada de clusterizacao, com o algoritmo k-means . O conteudo dos agrupamentos foi analisado com as ferramentas Weblogo, String-DB e Gene Ontology. Os resultados obtidos mostram que os agrupamentos formados apresentam o conteudo da sequencia divergente ao padrao biologico canonico. Adicionalmente, a analise da interacao proteina-proteina indica que a funcao celular nao esta relacionada diretamente com a estrutura de nucleotideos dos promotores, uma vez que este ultimo foi o criterio a utilizado pelo algoritmo K- means para realizar os agrupamentos. IN SILICO ANALYSIS OF ESCHERICHIA COLI PROMOTERS RECOGNIZED BY σ 28 FACTOR ABSTRACT The regulation of gene expression in prokaryotes provides the adequate response to environmental changes. The recognition of the promoter sequence plays an important role in the specificity of gene expression, since σ factor binds in RNA polymerase enzyme starting the process. In this context, the aim of this study was to analyze the composition of promoter sequences recognized by σ28 factor of Escherichia coli (related to mobility and bacterial pathogenicity) and protein-protein ratio of organic products associated with these sequences. The promoters were grouped by clustering (a data mining technique) with k-means algorithm. The content of clusters was analyzed with Weblogo, String-DB and Gene Ontology tools. The sequence of clusters shows some degree of discrepancy with canonical biologic pattern. Besides, none of the clusters presented metabolic function specificity. Furthermore, the protein-protein interaction analysis indicates that there is no relation between cellular function and nucleotide content, since this was the main criterion used by k-means algorithm in the generation of clusters.
Archaea are a vast and unexplored cellular domain that thrive in a high diversity of environments... more Archaea are a vast and unexplored cellular domain that thrive in a high diversity of environments, having central roles in processes mediating global carbon and nutrient fluxes. For these organisms to balance their metabolism, the appropriate regulation of their gene expression is essential. A key momentum in regulating genes responsible for the life maintenance of archaea is when transcription factor proteins bind to the promoter element. This DNA segment is conserved, which enables its exploration by machine learning techniques. Here, we trained and tested a support vector machine with 3935 known archaeal promoter sequences. All promoter sequences were coded into DNA Duplex Stability. After, we performed a model interpretation task to map the decision pattern of the classification procedure. We also used a dataset of known-promoter sequences for validation. Our results showed that an AT rich region around position − 27 upstream (relative to the start TSS) is the most conserved in ...
Os softwares educacionais podem ser utilizados pelos professores para auxiliar os alunos, entreta... more Os softwares educacionais podem ser utilizados pelos professores para auxiliar os alunos, entretanto, avaliar um software educacional é imprescindível para a qualidade do processo pedagógico. Este artigo discute critérios e formas de avaliação de software educacional e, como objetivo principal apresenta uma metodologia de avaliação de software educacional com base no framework DECIDE, proposto para avaliação de interfaces, o qual propõe que sejam realizadas observações das interações dos usuários com o software. Além disso, esta ferramenta possui fácil acessibilidade e não exige conhecimentos prévios do usuário. Foram avaliados dois softwares educacionais, o primeiro desses, intitulado A Coruja Boo, de formato mais lúdico, possui como público-alvo alunos da Educação Infantil, e o segundo, GeoGebra possui como público-alvo alunos do Ensino Fundamental II e Médio, pois exige conhecimento lógico matemático. A análise dos dados permitiu concluir que o framework contribui para a avaliaçã...
Background The severe form of COVID-19 can cause a dysregulated host immune syndrome that might l... more Background The severe form of COVID-19 can cause a dysregulated host immune syndrome that might lead patients to death. To understand the underlying immune mechanisms that contribute to COVID-19 disease we have examined 28 different biomarkers in two cohorts of COVID-19 patients, aiming to systematically capture, quantify, and algorithmize how immune signals might be associated to the clinical outcome of COVID-19 patients. Methods The longitudinal concentration of 28 biomarkers of 95 COVID-19 patients was measured. We performed a dimensionality reduction analysis to determine meaningful biomarkers for explaining the data variability. The biomarkers were used as input of artificial neural network, random forest, classification and regression trees, k-nearest neighbors and support vector machines. Two different clinical cohorts were used to grant validity to the findings. Results We benchmarked the classification capacity of two COVID-19 clinicals studies with different models and fou...
A preservação e o gerenciamento da informação é crucial para qualquer organização. O Instituto Me... more A preservação e o gerenciamento da informação é crucial para qualquer organização. O Instituto Memória Histórica e Cultural (IMHC) visa restaurar e preservar artefatos que retratam a vida dos habitantes da serra gaúcha. Considerando a importância do acervo como fonte de estudo para diversas áreas do conhecimento, constatou-se a necessidade de padronizar o sistema arquivístico pertinente ao IMHC. Este processo é relevante uma vez que alguns dos departamentos do IMHC possuem seu próprio sistema de banco de dados, enquanto outros não possuem ferramentas tecnológicas para o gerenciamento do conteúdo arquivístico. O presente artigo tem como objetivo relatar a aplicabilidade dos softwares Archivematica e AtoM junto ao acervo histórico cultural do IMHC. Os resultados indicam que os softwares proporcionarão as funcionalidades necessárias para o gerenciamento do acervo arquivístico, contribuindo para a gestão informacional do IMHC.
Background Archaea are a vast and unexplored domain. Bioinformatic techniques might enlighten the... more Background Archaea are a vast and unexplored domain. Bioinformatic techniques might enlighten the path to a higher quality genome annotation in varied organisms. Promoter sequences of archaea have the action of a plethora of proteins upon it. The conservation found in a structural level of the binding site of proteins such as TBP, TFB, and TFE aids RNAP-DNA stabilization and makes the archaeal promoter prone to be explored by statistical and machine learning techniques. Results and discussions In this study, experimentally verified promoter sequences of the organisms Haloferax volcanii, Sulfolobus solfataricus, and Thermococcus kodakarensis were converted into DNA duplex stability attributes (i.e. numerical variables) and were classified through Artificial Neural Networks and an in-house statistical method of classification, being tested with three forms of controls. The recognition of these promoters enabled its use to validate unannotated promoter sequences in other organisms. As ...
The amount of available data is continuously growing. This phenomenon promotes a new concept, nam... more The amount of available data is continuously growing. This phenomenon promotes a new concept, named big data. The highlight technologies related to big data are cloud computing (infrastructure) and Not Only SQL (NoSQL; data storage). In addition, for data analysis, machine learning algorithms such as decision trees, support vector machines, artificial neural networks, and clustering techniques present promising results. In a biological context, big data has many applications due to the large number of biological databases available. Some limitations of biological big data are related to the inherent features of these data, such as high degrees of complexity and heterogeneity, since biological systems provide information from an atomic level to interactions between organisms or their environment. Such characteristics make most bioinformatic-based applications difficult to build, configure, and maintain. Although the rise of big data is relatively recent, it has contributed to a better understanding of the underlying mechanisms of life. The main goal of this article is to provide a concise and reliable survey of the application of big data-related technologies in biology. As such, some fundamental concepts of information technology, including storage resources, analysis, and data sharing, are described along with their relation to biological data.
Revista Interdisciplinar de Ciência Aplicada, 2021
Resumo: A Bioinformática compõe um campo multidisciplinar que reúne pesquisadores das áreas de Ci... more Resumo: A Bioinformática compõe um campo multidisciplinar que reúne pesquisadores das áreas de Ciências da Vida e Ciência da Computação. Sua atuação na Universidade de Caxias do Sul (UCS) iniciou no ano de 2003 com pesquisas envolvendo a análise de wavelets em genomas. Desde então, foram fundados o Núcleo de Pesquisa (NP) em Bioinformática e o Computational Biology and Bioinformatics Laboratory (CBBL)-Laboratório de Biologia Computacional e Bioinformática. Os principais objetivos do NP são consolidar as atividades na área de Bioinformática na UCS e disponibilizar aos pesquisadores ferramentas computacionais inovadoras para auxílio na pesquisa experimental. O núcleo atualmente atua em três linhas principais de pesquisa: análise de sequências promotoras bacterianas, montagem e anotação de genomas de fungos e desenvolvimento de softwares de integração. Para produção científi ca, o NP também conta com a interação entre pesquisadores nacionais e internacionais. A pesquisa desenvolvida pelo NP tem alta relevância em função do conhecimento que agrega à comunidade científi ca ao processar adequadamente grandes volumes de dados experimentais.
O aumento na producao de produtos eletronicos, bem como o aumento do consumo destes bens, geram u... more O aumento na producao de produtos eletronicos, bem como o aumento do consumo destes bens, geram uma preocupacao quanto ao destino do lixo eletronico, o qual pode ser considerado como qualquer material eletroeletronico descartado ou obsoleto. Neste sentido, este artigo buscou analisar os aspectos relacionados a este assunto por meio de uma Revisao Sistematica de Literatura (RSL), buscando artigos relacionados ao descarte do lixo eletronico. A base de dados utilizada para consulta foi o Periodicos CAPES, com palavras-chave relacionadas ao tema. Os artigos resultantes foram selecionados de acordo com os seguintes criterios: somente os documentos do tipo artigo; publicados nos ultimos 5 anos; com titulo e resumo relacionados. No total, foram selecionados 11 artigos para leitura completa. Na analise de conteudo destes artigos, observou-se que as consequencias do descarte inadequado de lixo eletronico mais citadas foram: os danos ambientais e os danos a saude humana. Em relacao as medidas...
The gene transcription of bacteria starts with a promoter sequence being recognized by a transcri... more The gene transcription of bacteria starts with a promoter sequence being recognized by a transcription factor found in the RNAP enzyme, this process is assisted through the conservation of nucleotides as well as other factors governing these intergenic regions. Faced with this, the coding of genetic information into physical aspects of the DNA such as enthalpy, stability, and base-pair stacking could suggest promoter activity as well as protrude differentiation of promoter and non-promoter data. In this work, a total of 3131 promoter sequences associated to six different sigma factors in the bacterium E. coli were converted into numeric attributes, a strong set of control sequences referring to a shuffled version of the original sequences as well as coding regions is provided. Then, the parameterized genetic information was normalized, exhaustively analyzed through statistical tests. The results suggest that strong signals in the promoter sequences match the binding site of transcri...
Varias prefeituras da serra gaucha possuem o seu Sistema de Arrecadacao Municipal (SAM). Este sis... more Varias prefeituras da serra gaucha possuem o seu Sistema de Arrecadacao Municipal (SAM). Este sistema foi desenvolvido utilizando-se a linguagem de programacao COBOL, sendo considerado um sistema legado por ser utilizado ha mais de dez anos. A versao atual do SAM nao apresenta a funcionalidade de integracao com sistemas desenvolvidos para a plataformas web . Nesse sentido, a migracao de sistemas legados requer um planejamento e execucao minuciosos, uma vez que o sistema deve ser substituido sem interrupcao da prestacao de servicos a comunidade. Este artigo apresenta uma metodologia de migracao do SAM para uma versao desenvolvida para a plataforma web . O projeto de migracao utiliza as boas praticas de gerenciamento de projetos descritas no guia do PMBOK (Project Management Body of Knowledge) com o intuito de manter o alinhamento estrategico entre a TI (Tecnologia da Informacao) e o negocio das prefeituras.
As tecnologias computacionais vem sendo introduzidas na pratica pedagogica com a finalidade de au... more As tecnologias computacionais vem sendo introduzidas na pratica pedagogica com a finalidade de auxiliar no processo de construcao do saber. Assim, a utilizacao de uma ferramenta computacional no ambiente escolar requer analise sobre aspectos pedagogicos e da interacao do usuario com a ferramenta. Esse tipo de avaliacao torna-se relevante na analise de um Ambiente Virtual de Aprendizado (AVA), uma vez que dificuldades na interacao com o ambiente contribuem para o sentimento de frustracao e diminuicao de produtividade. Alem disso, pode levar o aluno a conclusoes equivocadas ou ate mesmo causar desinteresse pelas atividades desenvolvidas. Considerando esse contexto, o objetivo deste artigo foi analisar a utilizacao de um AVA por estudantes e professores da educacao basica. A metodologia aplicada foi de natureza qualitativa e de nivel exploratorio. A coleta de dados ocorreu por meio da observacao das interacoes dos usuarios com o AVA e sua analise foi guiada pelo framework DECIDE. Como ...
Many computational methods aim to improve the prediction and recognition of transcription element... more Many computational methods aim to improve the prediction and recognition of transcription elements in prokaryotes. Despite this, the natural features of those elements make their prediction and recognition remain as an open field of research. In this paper, we compared the open-access tools BacPP, BPROM, bTSSfinder, CNNPromoter_b, iPro70-PseZNC, NNPP2, PePPer, and PromPredict. First, we listed the overall functionalities of each tool and the resources available on their web pages. Later, we carried out a comparison of prediction results using 206 intergenic regions. When evaluating the prediction using intergenic regions containing a single promoter within each, NNPP2 and BacPP obtained >90% correct predictions, with NNPP2 obtaining the highest values of match between predicted promoter location and location indicated by RegulonDB. Overall, many discrepancies were observed among the results. They may be explained by the differences in the methodologies that each tool applies for ...
A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resp... more A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resposta adequada destes organismos as mudancas ambientais. Neste processo, a especificidade da expressao dos genes se da por meio da ligacao do fator σ na enzima RNA polimerase, e o posterior reconhecimento do promotor. O objetivo deste trabalho foi analisar a composicao das sequencias promotoras reconhecidas pelo fator σ 28 (relacionado com mobilidade e patogenicidade bacteriana) e a relacao proteina-proteina dos produtos biologicos associados a estas sequencias. Os promotores de Escherichia coli foram agrupados utilizando a tecnica de mineracao de dados denominada de clusterizacao, com o algoritmo k-means . O conteudo dos agrupamentos foi analisado com as ferramentas Weblogo, String-DB e Gene Ontology. Os resultados obtidos mostram que os agrupamentos formados apresentam o conteudo da sequencia divergente ao padrao biologico canonico. Adicionalmente, a analise da interacao proteina-prote...
Esse trabalho descreve a implementacao de um software de integracao de bancos de dados heterogene... more Esse trabalho descreve a implementacao de um software de integracao de bancos de dados heterogeneos relacionados a beneficios socioassistenciais. A criacao de uma base de dados integrada permite centralizar as informacoes dos recursos publicos utilizados. A aplicacao permite a importacao de dados de quatro bases: Programa Bolsa Familia (PBF), Beneficio Prestacao Continuada (BPC), Renda Mensal Vitalicia (RMV) e Cadastro Unico. A arquitetura do software e baseada no conceito MVC, e o backend foi desenvolvido utilizando a linguagem de programacao PHP, com o auxilio do framework Codeigniter e do banco de dados MySQL . Ao final deste artigo sao descritos os resultados da importacao dos dados, o que mostra como a falta de integracao gera informacoes redundantes e de baixa qualidade. Adicionalmente, discute-se as possibilidades de aprimoramento da gestao com o uso da ferramenta. Palavras-chave: beneficios socioassistenciais; gestao publica; integracao dados.
The acquired immunodeficiency syndrome (AIDS) is a leading global pandemic. Its virus, the HIV, e... more The acquired immunodeficiency syndrome (AIDS) is a leading global pandemic. Its virus, the HIV, enhances the destruction of the infected subject's immune system, and it has led millions of people to death every year [1]. HIV is a retrovirus belonging to the lentivirus family and has a great genetic diversity due to replication speed and evolution. It can be classified thus in various lineages, being HIV-1 the predominant worldwide. To assist in the study of these viruses, as well as other aspects of molecular biology, it is of vital importance to develop computational tools that allow analyzing biomolecules such as DNA, RNA and protein at a sequence organization level [2-4]. Thus, the possibility of making comparisons between DNA sequences of different strains of HIV may lead to elucidate aspects of the mutability of the virus and/or eventual deficiencies in its replication system. In this study, we selected two main genes (because of its importance in the HIV biology) from HIV ...
Existem alguns bancos de dados relacionados às sequências regulatórias da expressão gênica. No en... more Existem alguns bancos de dados relacionados às sequências regulatórias da expressão gênica. No entanto, existe uma lacuna quando se trata de sequências intergênicas de bactérias com informações genéticas associadas. Assim, o portal IntergenicDB, um repositório de público de sequências genômicas, vem ao encontro dessa necessidade. Ele permite aos pesquisadores consultar as informações sobre as sequências de regiões intergênicas e, bem como as funções biológicas associadas por meio de uma interface amigável. Este artigo tem como objetivo descrever os procedimentos computacionais
The gene expression control is a fundamental process in cellular activities, performed through th... more The gene expression control is a fundamental process in cellular activities, performed through the interaction of multiple regulatory mechanisms. The proper regulation of transcription is crucial for a single-cell prokaryote since its environment can change dramatically and instantly. The promoters are recognized as one of the transcription regulatory regions, since recruit the transcriptional machinery through the binding of regulatory proteins in their DNA sequences. The characterizing promoter regions in silico has difficulties, since these elements are short and degenerated, providing a high probability of finding similar sequences in other parts of the genome. Therefore, the embedding of structural characteristics can increase the accuracy of prediction methods [1-2]. In bacteria, RNApolymerase holoenzyme is responsible for promoter recognition and the gene expression starts. This enzyme consists of five subunits (2α, β, β', ω) and an additional sigma (σ) subunit factor. A collection of different σ subunits act as key regulators of bacterial gene expression. The substitution of one σ factor by another can initiate the transcription of different groups of genes [3]. A promoter sequence is characterized by the presence of two conserved DNA elements called-10 and-35 (upstream). These elements are defined according to the distance which have in relation to the transcriptional start site (position 1) and are represented by TATAAT-TTGACA nucleotides [4]. The upstream region (promoter) has distinct sequence properties compared to downstream region (non-promoter), such as differences in the structural characteristics of flexibility, stability and curvature [5]. Artificial neural networks (ANNs) have been widely used in nucleic acid sequences analysis, since they present ability to recognize and classify quantitative and qualitative patterns in data analysis [6]. This work aims to predict, recognize and characterize promoter regions recognized by sigma factor 28 (σ28) employing an approach of artificial neural networks using as input parameter curvature and flexibility data of the sequence.
A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resp... more A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resposta adequada destes organismos as mudancas ambientais. Neste processo, a especificidade da expressao dos genes se da por meio da ligacao do fator σ na enzima RNA polimerase, e o posterior reconhecimento do promotor. O objetivo deste trabalho foi analisar a composicao das sequencias promotoras reconhecidas pelo fator σ 28 (relacionado com mobilidade e patogenicidade bacteriana) e a relacao proteina-proteina dos produtos biologicos associados a estas sequencias. Os promotores de Escherichia coli foram agrupados utilizando a tecnica de mineracao de dados denominada de clusterizacao, com o algoritmo k-means . O conteudo dos agrupamentos foi analisado com as ferramentas Weblogo, String-DB e Gene Ontology. Os resultados obtidos mostram que os agrupamentos formados apresentam o conteudo da sequencia divergente ao padrao biologico canonico. Adicionalmente, a analise da interacao proteina-proteina indica que a funcao celular nao esta relacionada diretamente com a estrutura de nucleotideos dos promotores, uma vez que este ultimo foi o criterio a utilizado pelo algoritmo K- means para realizar os agrupamentos. IN SILICO ANALYSIS OF ESCHERICHIA COLI PROMOTERS RECOGNIZED BY σ 28 FACTOR ABSTRACT The regulation of gene expression in prokaryotes provides the adequate response to environmental changes. The recognition of the promoter sequence plays an important role in the specificity of gene expression, since σ factor binds in RNA polymerase enzyme starting the process. In this context, the aim of this study was to analyze the composition of promoter sequences recognized by σ28 factor of Escherichia coli (related to mobility and bacterial pathogenicity) and protein-protein ratio of organic products associated with these sequences. The promoters were grouped by clustering (a data mining technique) with k-means algorithm. The content of clusters was analyzed with Weblogo, String-DB and Gene Ontology tools. The sequence of clusters shows some degree of discrepancy with canonical biologic pattern. Besides, none of the clusters presented metabolic function specificity. Furthermore, the protein-protein interaction analysis indicates that there is no relation between cellular function and nucleotide content, since this was the main criterion used by k-means algorithm in the generation of clusters.
Archaea are a vast and unexplored cellular domain that thrive in a high diversity of environments... more Archaea are a vast and unexplored cellular domain that thrive in a high diversity of environments, having central roles in processes mediating global carbon and nutrient fluxes. For these organisms to balance their metabolism, the appropriate regulation of their gene expression is essential. A key momentum in regulating genes responsible for the life maintenance of archaea is when transcription factor proteins bind to the promoter element. This DNA segment is conserved, which enables its exploration by machine learning techniques. Here, we trained and tested a support vector machine with 3935 known archaeal promoter sequences. All promoter sequences were coded into DNA Duplex Stability. After, we performed a model interpretation task to map the decision pattern of the classification procedure. We also used a dataset of known-promoter sequences for validation. Our results showed that an AT rich region around position − 27 upstream (relative to the start TSS) is the most conserved in ...
Os softwares educacionais podem ser utilizados pelos professores para auxiliar os alunos, entreta... more Os softwares educacionais podem ser utilizados pelos professores para auxiliar os alunos, entretanto, avaliar um software educacional é imprescindível para a qualidade do processo pedagógico. Este artigo discute critérios e formas de avaliação de software educacional e, como objetivo principal apresenta uma metodologia de avaliação de software educacional com base no framework DECIDE, proposto para avaliação de interfaces, o qual propõe que sejam realizadas observações das interações dos usuários com o software. Além disso, esta ferramenta possui fácil acessibilidade e não exige conhecimentos prévios do usuário. Foram avaliados dois softwares educacionais, o primeiro desses, intitulado A Coruja Boo, de formato mais lúdico, possui como público-alvo alunos da Educação Infantil, e o segundo, GeoGebra possui como público-alvo alunos do Ensino Fundamental II e Médio, pois exige conhecimento lógico matemático. A análise dos dados permitiu concluir que o framework contribui para a avaliaçã...
Background The severe form of COVID-19 can cause a dysregulated host immune syndrome that might l... more Background The severe form of COVID-19 can cause a dysregulated host immune syndrome that might lead patients to death. To understand the underlying immune mechanisms that contribute to COVID-19 disease we have examined 28 different biomarkers in two cohorts of COVID-19 patients, aiming to systematically capture, quantify, and algorithmize how immune signals might be associated to the clinical outcome of COVID-19 patients. Methods The longitudinal concentration of 28 biomarkers of 95 COVID-19 patients was measured. We performed a dimensionality reduction analysis to determine meaningful biomarkers for explaining the data variability. The biomarkers were used as input of artificial neural network, random forest, classification and regression trees, k-nearest neighbors and support vector machines. Two different clinical cohorts were used to grant validity to the findings. Results We benchmarked the classification capacity of two COVID-19 clinicals studies with different models and fou...
A preservação e o gerenciamento da informação é crucial para qualquer organização. O Instituto Me... more A preservação e o gerenciamento da informação é crucial para qualquer organização. O Instituto Memória Histórica e Cultural (IMHC) visa restaurar e preservar artefatos que retratam a vida dos habitantes da serra gaúcha. Considerando a importância do acervo como fonte de estudo para diversas áreas do conhecimento, constatou-se a necessidade de padronizar o sistema arquivístico pertinente ao IMHC. Este processo é relevante uma vez que alguns dos departamentos do IMHC possuem seu próprio sistema de banco de dados, enquanto outros não possuem ferramentas tecnológicas para o gerenciamento do conteúdo arquivístico. O presente artigo tem como objetivo relatar a aplicabilidade dos softwares Archivematica e AtoM junto ao acervo histórico cultural do IMHC. Os resultados indicam que os softwares proporcionarão as funcionalidades necessárias para o gerenciamento do acervo arquivístico, contribuindo para a gestão informacional do IMHC.
Background Archaea are a vast and unexplored domain. Bioinformatic techniques might enlighten the... more Background Archaea are a vast and unexplored domain. Bioinformatic techniques might enlighten the path to a higher quality genome annotation in varied organisms. Promoter sequences of archaea have the action of a plethora of proteins upon it. The conservation found in a structural level of the binding site of proteins such as TBP, TFB, and TFE aids RNAP-DNA stabilization and makes the archaeal promoter prone to be explored by statistical and machine learning techniques. Results and discussions In this study, experimentally verified promoter sequences of the organisms Haloferax volcanii, Sulfolobus solfataricus, and Thermococcus kodakarensis were converted into DNA duplex stability attributes (i.e. numerical variables) and were classified through Artificial Neural Networks and an in-house statistical method of classification, being tested with three forms of controls. The recognition of these promoters enabled its use to validate unannotated promoter sequences in other organisms. As ...
The amount of available data is continuously growing. This phenomenon promotes a new concept, nam... more The amount of available data is continuously growing. This phenomenon promotes a new concept, named big data. The highlight technologies related to big data are cloud computing (infrastructure) and Not Only SQL (NoSQL; data storage). In addition, for data analysis, machine learning algorithms such as decision trees, support vector machines, artificial neural networks, and clustering techniques present promising results. In a biological context, big data has many applications due to the large number of biological databases available. Some limitations of biological big data are related to the inherent features of these data, such as high degrees of complexity and heterogeneity, since biological systems provide information from an atomic level to interactions between organisms or their environment. Such characteristics make most bioinformatic-based applications difficult to build, configure, and maintain. Although the rise of big data is relatively recent, it has contributed to a better understanding of the underlying mechanisms of life. The main goal of this article is to provide a concise and reliable survey of the application of big data-related technologies in biology. As such, some fundamental concepts of information technology, including storage resources, analysis, and data sharing, are described along with their relation to biological data.
Revista Interdisciplinar de Ciência Aplicada, 2021
Resumo: A Bioinformática compõe um campo multidisciplinar que reúne pesquisadores das áreas de Ci... more Resumo: A Bioinformática compõe um campo multidisciplinar que reúne pesquisadores das áreas de Ciências da Vida e Ciência da Computação. Sua atuação na Universidade de Caxias do Sul (UCS) iniciou no ano de 2003 com pesquisas envolvendo a análise de wavelets em genomas. Desde então, foram fundados o Núcleo de Pesquisa (NP) em Bioinformática e o Computational Biology and Bioinformatics Laboratory (CBBL)-Laboratório de Biologia Computacional e Bioinformática. Os principais objetivos do NP são consolidar as atividades na área de Bioinformática na UCS e disponibilizar aos pesquisadores ferramentas computacionais inovadoras para auxílio na pesquisa experimental. O núcleo atualmente atua em três linhas principais de pesquisa: análise de sequências promotoras bacterianas, montagem e anotação de genomas de fungos e desenvolvimento de softwares de integração. Para produção científi ca, o NP também conta com a interação entre pesquisadores nacionais e internacionais. A pesquisa desenvolvida pelo NP tem alta relevância em função do conhecimento que agrega à comunidade científi ca ao processar adequadamente grandes volumes de dados experimentais.
O aumento na producao de produtos eletronicos, bem como o aumento do consumo destes bens, geram u... more O aumento na producao de produtos eletronicos, bem como o aumento do consumo destes bens, geram uma preocupacao quanto ao destino do lixo eletronico, o qual pode ser considerado como qualquer material eletroeletronico descartado ou obsoleto. Neste sentido, este artigo buscou analisar os aspectos relacionados a este assunto por meio de uma Revisao Sistematica de Literatura (RSL), buscando artigos relacionados ao descarte do lixo eletronico. A base de dados utilizada para consulta foi o Periodicos CAPES, com palavras-chave relacionadas ao tema. Os artigos resultantes foram selecionados de acordo com os seguintes criterios: somente os documentos do tipo artigo; publicados nos ultimos 5 anos; com titulo e resumo relacionados. No total, foram selecionados 11 artigos para leitura completa. Na analise de conteudo destes artigos, observou-se que as consequencias do descarte inadequado de lixo eletronico mais citadas foram: os danos ambientais e os danos a saude humana. Em relacao as medidas...
The gene transcription of bacteria starts with a promoter sequence being recognized by a transcri... more The gene transcription of bacteria starts with a promoter sequence being recognized by a transcription factor found in the RNAP enzyme, this process is assisted through the conservation of nucleotides as well as other factors governing these intergenic regions. Faced with this, the coding of genetic information into physical aspects of the DNA such as enthalpy, stability, and base-pair stacking could suggest promoter activity as well as protrude differentiation of promoter and non-promoter data. In this work, a total of 3131 promoter sequences associated to six different sigma factors in the bacterium E. coli were converted into numeric attributes, a strong set of control sequences referring to a shuffled version of the original sequences as well as coding regions is provided. Then, the parameterized genetic information was normalized, exhaustively analyzed through statistical tests. The results suggest that strong signals in the promoter sequences match the binding site of transcri...
Varias prefeituras da serra gaucha possuem o seu Sistema de Arrecadacao Municipal (SAM). Este sis... more Varias prefeituras da serra gaucha possuem o seu Sistema de Arrecadacao Municipal (SAM). Este sistema foi desenvolvido utilizando-se a linguagem de programacao COBOL, sendo considerado um sistema legado por ser utilizado ha mais de dez anos. A versao atual do SAM nao apresenta a funcionalidade de integracao com sistemas desenvolvidos para a plataformas web . Nesse sentido, a migracao de sistemas legados requer um planejamento e execucao minuciosos, uma vez que o sistema deve ser substituido sem interrupcao da prestacao de servicos a comunidade. Este artigo apresenta uma metodologia de migracao do SAM para uma versao desenvolvida para a plataforma web . O projeto de migracao utiliza as boas praticas de gerenciamento de projetos descritas no guia do PMBOK (Project Management Body of Knowledge) com o intuito de manter o alinhamento estrategico entre a TI (Tecnologia da Informacao) e o negocio das prefeituras.
As tecnologias computacionais vem sendo introduzidas na pratica pedagogica com a finalidade de au... more As tecnologias computacionais vem sendo introduzidas na pratica pedagogica com a finalidade de auxiliar no processo de construcao do saber. Assim, a utilizacao de uma ferramenta computacional no ambiente escolar requer analise sobre aspectos pedagogicos e da interacao do usuario com a ferramenta. Esse tipo de avaliacao torna-se relevante na analise de um Ambiente Virtual de Aprendizado (AVA), uma vez que dificuldades na interacao com o ambiente contribuem para o sentimento de frustracao e diminuicao de produtividade. Alem disso, pode levar o aluno a conclusoes equivocadas ou ate mesmo causar desinteresse pelas atividades desenvolvidas. Considerando esse contexto, o objetivo deste artigo foi analisar a utilizacao de um AVA por estudantes e professores da educacao basica. A metodologia aplicada foi de natureza qualitativa e de nivel exploratorio. A coleta de dados ocorreu por meio da observacao das interacoes dos usuarios com o AVA e sua analise foi guiada pelo framework DECIDE. Como ...
Many computational methods aim to improve the prediction and recognition of transcription element... more Many computational methods aim to improve the prediction and recognition of transcription elements in prokaryotes. Despite this, the natural features of those elements make their prediction and recognition remain as an open field of research. In this paper, we compared the open-access tools BacPP, BPROM, bTSSfinder, CNNPromoter_b, iPro70-PseZNC, NNPP2, PePPer, and PromPredict. First, we listed the overall functionalities of each tool and the resources available on their web pages. Later, we carried out a comparison of prediction results using 206 intergenic regions. When evaluating the prediction using intergenic regions containing a single promoter within each, NNPP2 and BacPP obtained >90% correct predictions, with NNPP2 obtaining the highest values of match between predicted promoter location and location indicated by RegulonDB. Overall, many discrepancies were observed among the results. They may be explained by the differences in the methodologies that each tool applies for ...
A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resp... more A regulacao da transcricao genica em seres procariotos desempenha um papel importante para a resposta adequada destes organismos as mudancas ambientais. Neste processo, a especificidade da expressao dos genes se da por meio da ligacao do fator σ na enzima RNA polimerase, e o posterior reconhecimento do promotor. O objetivo deste trabalho foi analisar a composicao das sequencias promotoras reconhecidas pelo fator σ 28 (relacionado com mobilidade e patogenicidade bacteriana) e a relacao proteina-proteina dos produtos biologicos associados a estas sequencias. Os promotores de Escherichia coli foram agrupados utilizando a tecnica de mineracao de dados denominada de clusterizacao, com o algoritmo k-means . O conteudo dos agrupamentos foi analisado com as ferramentas Weblogo, String-DB e Gene Ontology. Os resultados obtidos mostram que os agrupamentos formados apresentam o conteudo da sequencia divergente ao padrao biologico canonico. Adicionalmente, a analise da interacao proteina-prote...
Esse trabalho descreve a implementacao de um software de integracao de bancos de dados heterogene... more Esse trabalho descreve a implementacao de um software de integracao de bancos de dados heterogeneos relacionados a beneficios socioassistenciais. A criacao de uma base de dados integrada permite centralizar as informacoes dos recursos publicos utilizados. A aplicacao permite a importacao de dados de quatro bases: Programa Bolsa Familia (PBF), Beneficio Prestacao Continuada (BPC), Renda Mensal Vitalicia (RMV) e Cadastro Unico. A arquitetura do software e baseada no conceito MVC, e o backend foi desenvolvido utilizando a linguagem de programacao PHP, com o auxilio do framework Codeigniter e do banco de dados MySQL . Ao final deste artigo sao descritos os resultados da importacao dos dados, o que mostra como a falta de integracao gera informacoes redundantes e de baixa qualidade. Adicionalmente, discute-se as possibilidades de aprimoramento da gestao com o uso da ferramenta. Palavras-chave: beneficios socioassistenciais; gestao publica; integracao dados.
The acquired immunodeficiency syndrome (AIDS) is a leading global pandemic. Its virus, the HIV, e... more The acquired immunodeficiency syndrome (AIDS) is a leading global pandemic. Its virus, the HIV, enhances the destruction of the infected subject's immune system, and it has led millions of people to death every year [1]. HIV is a retrovirus belonging to the lentivirus family and has a great genetic diversity due to replication speed and evolution. It can be classified thus in various lineages, being HIV-1 the predominant worldwide. To assist in the study of these viruses, as well as other aspects of molecular biology, it is of vital importance to develop computational tools that allow analyzing biomolecules such as DNA, RNA and protein at a sequence organization level [2-4]. Thus, the possibility of making comparisons between DNA sequences of different strains of HIV may lead to elucidate aspects of the mutability of the virus and/or eventual deficiencies in its replication system. In this study, we selected two main genes (because of its importance in the HIV biology) from HIV ...
Existem alguns bancos de dados relacionados às sequências regulatórias da expressão gênica. No en... more Existem alguns bancos de dados relacionados às sequências regulatórias da expressão gênica. No entanto, existe uma lacuna quando se trata de sequências intergênicas de bactérias com informações genéticas associadas. Assim, o portal IntergenicDB, um repositório de público de sequências genômicas, vem ao encontro dessa necessidade. Ele permite aos pesquisadores consultar as informações sobre as sequências de regiões intergênicas e, bem como as funções biológicas associadas por meio de uma interface amigável. Este artigo tem como objetivo descrever os procedimentos computacionais
Uploads
Papers by Scheila Silva