Unidad
03

Bienvenida

Como lo revisaste en las unidades anteriores, hoy en día contamos con una vasta cantidad de información a partir de genomas ya secuenciados de diversas especies. Esta información es útil para inferir la secuencia de aminoácidos de una proteína con base en el código genético a partir de la secuencia de nucleótidos.

En la actualidad disponemos de la secuencia de millones de proteínas basadas en la traducción teórica a través de secuencias de DNA. Es por eso que para el análisis eficiente de toda esta información se necesitan algoritmos y sistemas de cómputo que sean de utilidad para poder predecir la estructura de una proteína, su función, la interacción con ligandos y/o sus posibles ancestros evolutivos.

En esta unidad se presentan algunas herramientas bioinformáticas para el análisis de las secuencias de proteínas. La identidad de una proteína está determinada por su estructura primaria, es decir, su secuencia de aminoácidos.

Si bien los métodos experimentales que permiten la secuenciación de proteínas han sido de mucha importancia para poder caracterizar algunas proteínas, en la actualidad la mayor parte de las secuencias de proteínas proviene de su inferencia a partir de la secuencia de nucleótidos de los genes que las codifican (Jiménez y Merchant, 2003).

Sin embargo, es importante tener en cuenta que no siempre es posible predecir con certeza a partir de la secuencia de ácidos nucleicos las características de una proteína. En algunos casos las modificaciones que éstas sufren después del proceso de traducción son fundamentales para su función (Reece, 2004).

En muchos casos la vasta información que se tiene en las bases de datos permite hacer inferencias estructurales y funcionales con base a lo que ya se conoce para otras proteínas con secuencias similares.

Competencia específica

Interpretar el contenido de secuencias de aminoácidos para determinar la aplicación práctica de las herramientas moleculares a través del empleo de software.


Logros

  • Distinguir el tipo de información proteómica que se puede adquirir y analizar a partir de diversos softwares.
  • Identificar la relación que existe entre la secuencia y estructura de una proteína con su función biológica.
  • Determinar características intrínsecas de una secuencia de aminoácidos específica por medio de programas informáticos.

Contenido

Unidad 3. Análisis de secuencias de aminoácidos

  • 3.1. Conversión de la información del ADN a aminoácidos

  • 3.2. Análisis de secuencias de aminoácidos

    3.2.1. Alineamiento de secuencias de aminoácidos

    3.2.2. Predicción de la estructura de proteínas

    3.2.3. Relación de la secuencia de aminoácidos con la función biológica de la proteína

    3.2.4. Análisis de secuencias específicas

  • 3.3. Aplicaciones prácticas del análisis de secuencias de aminoácidos

    3.3.1 Determinación de propiedades fisicoquímicas de las proteínas

    3.3.2. Acoplamiento molecular para el estudio de proteínas

Material de estudio

Da clic en el ícono para descargar el contenido de la unidad 3.

Cierre

Los avances en la tecnología de secuenciación han revolucionado muchos aspectos de la biología, hoy en día contamos con bases de datos especializadas y de acceso público, que facilitan el estudio del ADN, ARN y las proteínas.

Después de haber hecho un recorrido por algunas de las herramientas que la bioinformática ofrece te podrás dar cuenta que esta disciplina no solamente es útil para el análisis de secuencias y de estructuras, sino que también ofrece muchas opciones para el diseño de moléculas útiles para la ingeniería bioquímica.

Actualmente gracias a la creación de diversos programas, se puede modelar una proteína de interés y su interacción con otras moléculas para poder inferir la reacción que cataliza una enzima o bien para el diseño de moléculas como fármacos.

Finalmente es importante recalcar que debido a los rápidos avances de la tecnología los programas y bases de datos están en continua actualización y mejoramiento, es por ello que la bioinformática ofrece día a día nuevas y mejores metodologías para resolver problemas de la ciencia.

Fuentes de consulta

Básica

  • Acharya K. R., Stuart D. I., Walker N. P., Lewis M., Phillips D. C. (1989). Refined structure of baboon alpha-lactalbumin at 1.7 A resolution. Comparison with C-type lysozyme. J.Mol. Biol. 208:99-127.
  • Borden K.L.B., Freemont P.S (1996). The RING finger domain: a recent example of a sequence-structure family. Curr. Opin. Struct. Biol. 6:395-401.
  • Brown S.M. (2000). Bioinformatics. A biologist´s guide to biocomputing and the internet. New York: Eaton Publishing.
  • Bru C, Courcelle E, Carrère S, Beausse Y, Dalmar S, Kahn D. (2005) The ProDom database of protein domain families: more emphasis on 3D. Nucleic Acids Res.1;33:D212-5.
  • Buehler L.K., Rashidi H.H. (Eds.) (2005). Bioinformatics Basics. Applications in Biological Science and Medicine. Second Edition. EUA: Taylor & Francis.
  • Chis L., Hriscu M., Bica A., Tosa M, Nagy G., Róna G., Vértessy B.G., Irimie F.D. (2013). Molecular cloning and characterization of a thermostable esterase/lipase produced by a novel Anoxybacillus flavithermus strain. J. Gen. Appl. Microbiol., 59:119-134.
  • Chou KC, Elrod DW. (1999). Prediction of membrane protein types and subcellular locations. Proteins. 34(1):137–153.
  • Cid H, Bunster M, Canales M, Gazitua F. (1992) Hydrophobicity and structural classes in proteins. Protein Eng. 5(5):373–375.
  • Combet C., Blanchet C., Geourjon C. Deléage G. (200). Network Protein Sequence Analysis. TIBS, 25:[291]:147-150.
  • Dokholyana NV, Mirnya LA, Shakhnovicha EI. (2002). Understanding conserved amino acids in proteins. Physica A, 314:600-606.
  • Eisenhaber F, Imperiale F, Argos P, Frommel C. (1996). Prediction of secondary structural content of proteins from their amino acid composition alone. I. New analytic vector decomposition methods. Proteins. 25(2):157–168.
  • Gromiha MM. (2010). Protein Bioinformatics: From Sequence to Function. ELSEVIER. SBN: 978-8-1312-2297-3
  • Hartl D. L., Jones E.W. (1998). Genetics. Principles and Analysis (4º Edition). EUA: Jones and Bartlett Publishers.
  • Hernández-Santoyo A, Tenorio-Barajas AY, Altuzar V, Vivanco-Cid H, Mendoza-Barrera C. (2013). Protein-Protein and Protein-Ligand Docking, Protein Engineering - Technology and Application, Dr. Tomohisa Ogawa (Ed.), ISBN: 978-953-51-1138-2, InTech, DOI: 10.5772/56376.
  • Jiménez García L. F., Merchant Larios H. (2003). Biología celular y molecular. México Pearson Education.
  • Koning J., Wanjun G., Castoe T., Batzer M., Pollock D. (2011). Repetitive elements may comprise over two-thirds of the human genome. PLoS Genet 7(12): e1002384. doi:10.1371/journal.pgen.1002384
  • Medzihradszky KF (2008). Characterization of site-specific N-Glycosylation post-translational odifications of proteins. Methods in Molecular Biology, 446:293-316.
  • Mount D.W. (2001). Bioinformatics Sequence and Genome Analysis. New York: CSHL Press.
  • Orengo C.A., Jones D.T., Thornton J.M. (2003). Bioinformatics: Genes, proteins & computers. New York: BIOS Scientific Publishers.
  • Palczewski K. (2006) G Protein–coupled receptor Rhodopsin. Annu Rev Biochem. 75: 743–767.
  • Pautsch A, Schulz GE. (2000). High-resolution structure of the OmpA membrane domain. J Mol Biol. 298:273–282.
  • Perez A. (2011). Predicting Protein Complex Structures: A Review of the Docking Process. BIOC218 Final Project. Disponible en:
    http://biochem218.stanford.edu/Projects%202011/Perez%202011.pdf
  • Qasba PK, Kumar S (1997). Molecular divergence of lysozymes and alpha lactalbumin. Crit. Rev. Biochem. Mol. Biol. 32 (4): 255–306.
  • Ratledge C., Kristiansen B (Eds.) (2006). Basic Biotechnology. Third Edition. New York: Cambridge University Press.
  • Reece R.J. (2004). Analysis of genes and genomes. UK: John Wiley & Sons, Ldt.
  • Sander C, Schneider R. (1991). Database of homology-derived protein structures and the structural meaning of sequence alignment. Proteins. 9(1):56-68.
  • Sambrook J., Russell D. (2001). Molecular cloning: A laboratory manual. Cold spring harbor, tercera edición. Nueva York, USA. Segundo volumen, sección 8.13.
  • Schuler, G. Sequence Alignment and Database searching en: Baxevanis A.F., Ouellette, F. (2001). Bionformatics: A practical guide to the analysis of genes and proteins. 3ª Ed. UK: Wiley.
  • Shin D.H., Roberts A., Jancarik J., Yokota H., Kim R., David E. W. and Kim S. H. (2003). Crystal structure of a phosphatase with a unique substrate-binding domain from Thermotoga marítima. Protein Science, 12:1464–1472.
  • Sigrist CJA, de Castro E, Cerutti L, Cuche BA, Hulo N, Bridge A, Bougueleret L, Xenarios I. (2012). New and continuing developments at PROSITE. Nucleic Acids Res; doi: 10.1093/nar/gks1067.
  • Smith GR y Sternberg MJE (2002). Prediction of protein–protein interactions by docking methods Current Opinion in Structural Biology. 12:28–35.
  • Twyman RM. (2004). Principles of proteomics. New York. BIOS Scientific Publishers.
  • Von Heijne G. (1986). The distribution of positively charged residues in bacterial inner membrane proteins correlates with the trans-membrane topology. EMBO J. 5:3021–3027.
  • Wallin E, von Heijne G. (1998). Genome-wide analysis of integral membrane proteins from eubacterial, archaean, and eukaryotic organisms. Protein Sci. 7(4):1029–1038.
  • Westhead D.R., Parish J.H., Twyman R.M. (2002). Instant Notes Bioinformatics. New York. BIOS Scientific Publishers.
  • Zhang Z, Sun ZR, Zhang CT. (2001). A new approach to predict the helix/strand content of globular proteins. J Theor Biol. 208:65–78.