pág. 2945
PREDICCIÓN DE LA ESTRUCTURA
TRIDIMENSIONAL DE ENZIMAS CON
ACTIVIDAD DEGRADADORA DE
POLIURETANO EN EL AÑO 2023
PREDICTION OF THE THREE-DIMENSIONAL STRUCTURE OF
ENZYMES WITH POLYURETHANE-DEGRADING ACTIVITY IN
THE YEAR 2023
Elizabeth Troya Castillo
Universidad Nacional Pedro Ruiz Gallo, Perú
Alejandra Estela Miranda
Universidad Nacional Pedro Ruiz Gallo, Perú
Erick Giancarlo Suclupe Farro
Universidad Nacional Pedro Ruiz Gallo, Perú
pág. 2946
DOI:
Predicción de la Estructura Tridimensional de Enzimas con
Actividad Degradadora de Poliuretano en el Año 2023
Elizabeth Troya Castillo1
etroyaca@unprg.edu.pe
https://orcid.org/0000-0003-2599-4761
Universidad Nacional Pedro Ruiz Gallo
Perú
Alejandra Estela Miranda
aestelam@unprg.edu.pe
https://orcid.org/0009-0001-1653-9954
Universidad Nacional Pedro Ruiz Gallo
Perú
Erick Giancarlo Suclupe Farro
esuclupef@unprg.edu.pe
https://orcid.org/0000-0002-0334-2191
Universidad Nacional Pedro Ruiz Gallo
Perú
RESUMEN
El plástico ha provocado graves problemas ambientales y de salud pública a nivel global debido a
su uso extensivo. Este estudio se centra en la degradación de poliuretanos, destacando la
importancia de predecir la estructura de enzimas mediante AlphaFold y el docking molecular para
comprender su interacción con estos polímeros. La población deestudio incluyó todas las
secuencias de proteínas en PubMed, seleccionando una muestra representativa con actividad
catalítica relacionada con poliuretanos mediante búsqueda exhaustiva. Las secuencias,
identificadas por códigos GenBank, fueron recopiladas de PubMed y otras fuentes. Las
propiedades fisicoquímicas de las enzimas se caracterizaron con Protparam, realizando
alineamientos y cladogramas con Clustal Omega, identificando motivos con MEME, modelando
estructuras con ColabFold y evaluándolas con SAVES. El docking molecular se llevó a cabo
utilizando CB- Dock y AutoDock Vina. Se identificaron y caracterizaron 29 secuencias
enzimáticas: 7 poliuretanasas, 15 cutinasas y 7 lipasas, con agrupaciones filogenéticas distintas y
motifs significativos. El modelado en AlphaFold reveló
diferencias
estructurales evidenciadas
en modelos tridimensionales y sus puntuaciones de calidad. El docking molecular con el
poliuretanoproporcionó información sobre la potencial interacción de estas enzimas con el
compuesto. Este análisis meticuloso brindó un panorama detallado de propiedades, estructuras y
potenciales interacciones. Basándose en estructuras tridimensionales predichas por AlphaFold,
este estudio sugiereque las proteínas modeladas tienen un potencial significativo para unir y
potencialmente degradar poliuretanos, representando una valiosa contribución a la bioinformática
y prometiendo nuevas líneas de investigación en el estudio de proteínas y su actividad catalítica
con polímeros.
Palabras claves: Poliuretanos, Enzimas, AlphaFold, Docking molecular, Degradación
1
Autor principal
Correspondencia: etroyaca@unprg.edu.pe
pág. 2947
Prediction of the Three-Dimensional Structure of Enzymes with
Polyurethane-Degrading Activity in the Year 2023
ABSTRACT
Plastic has caused serious global environmental and public health problems due to its extensive
use. This study focuses on the degradation of polyurethanes, emphasizing the importance of
predicting enzyme structures through AlphaFold and molecular docking to understand their
interaction with these polymers. The study population encompassed all protein sequences in
PubMed, selecting a representative sample with catalytic activity related to polyurethanes
through exhaustive searches. Sequences, identified by GenBankcodes, were compiled from
PubMed and other sources. The physicochemical properties of the enzymes were characterized
using Protparam, and multiple alignments and cladograms were created with Clustal Omega.
Motifs were identified using MEME, andstructures were modeled with ColabFold and evaluated
with SAVES. Molecular docking was conducted using CB-Dock and AutoDock Vina. Twenty-
nine enzyme sequences wereidentified and characterized: 7 polyurethanases, 15 cutinases, and 7
lipases, exhibiting distinct phylogenetic groupings and significant motifs. AlphaFold modeling
revealed structural differences in three-dimensional models and their quality scores. Molecular
docking with polyurethane provided insights into the potential interaction of these enzymes with
the compound. This meticulous analysis offered a detailed overview of properties, structures,
and potential interactions. Based on three- dimensional structures predicted by AlphaFold, this
study suggests that the modeled proteins have significant potential to bind and potentially
degrade polyurethanes, representing a valuable contribution to bioinformatics and promising
new avenues of research in the study of proteins and their catalytic activity with polymers.
Keywords: Polyurethanes, Enzymes, AlphaFold, Molecular docking, Degradation
Artículo recibido 22 abril 2024
Aceptado para publicación: 25 mayo 2024
pág. 2948
INTRODUCCIÓN
La contaminación del plástico es un grave problema ambiental y de salud pública que afecta a todo
el mundo. El plástico es un material muy versátil y ampliamente utilizado en una gran variedad
de productos, desde envases y empaquetes hasta productos de consumo y equipamiento
industriales. Sin embargo, el uso masivo de plástico ha llevado a una serie de problemas
ambientales y de salud pública (Vandenberg et al., 2007).
Uno de los principales problemas es el desperdicio de plástico, causa por la cual muchos de
estos productos que son producidos acaban siendo utilizados solo una vez y luego desechados,
lo que contribuye a la creciente cantidad de residuos plásticos en el medio ambiente. Aunque
algunos plásticos son reciclados, la mayoría termina en vertederos o en el medio ambiente,
donde pueden tardar siglos en descomponerse (Eriksen et al., 2018).
El plástico también puede ser perjudicial para la salud humana y la de los animales, ya que
algunos tipos de plástico contienen químicos tóxicos que pueden ser liberados durante su
producción, uso o descomposición, y pueden ser dañinos para la salud humana si se inhalan o
entran en contacto con la piel (Pérez-García et al., 2021). Además, cuando el plástico se
descompone en el medio ambiente, puede liberar pequeñas partículas conocidas como
microplásticos, que pueden ser ingeridas por animales y luego subir por la cadena alimenticia
hasta llegar a los humanos (Ullah et al., 2023).
Otro problema es la contaminación causada por el plástico es que muchos de los productos de
plástico se utilizan en el exterior, lo que significa que pueden ser transportados por el viento
o la lluvia a lugares donde no son deseados, como ríos, océanos y playas. Esto puede tener un
impacto negativo en la fauna y la flora locales y puede dificultar la actividad humana, como la
pesca o el turismo (Plastics Europe, 2021).
La contaminación del plástico en los océanos es especialmente preocupante, estos residuos
plásticos flotan en el agua y pueden ser transportados por las corrientes marinas a grandes
distancias, lo que significa que el problema no es solo local sino global. Los residuos plásticos
pueden entrar en la cadena alimenticia marina y dañar la salud de los peces y otros animales
marinos, y también pueden afectar a los humanos que consumen esos animales. Además, el
pág. 2949
plástico puede obstaculizar la actividad humana y ocasionar un impacto económico negativo en
las comunidades que dependen de actividades extractivas y del turismo (Urbanek et al., 2018).
El plástico también puede tener un impacto ambiental negativo al liberar gases de efecto
invernadero durante su producción y su descomposición. La producción de plástico requiere
energía y la quema de combustibles fósiles (Magnin et al., 2020), lo que contribuye al cambio
climático. Además, cuando el plástico se descompone en el medio ambiente, libera gases de
efecto invernadero como el metano y el óxido de nitrógeno, que contribuyen a la intensificación
del cambio climático.
A pesar de estos problemas, el uso de plástico sigue siendo muy popular y se ha extendido a casi
todos los aspectos de nuestra vida. Sin embargo, es importante tomar medidas para reducir
nuestro consumo de plástico y promover prácticas más sostenibles en su producción y uso (Danso
et al., 2019).
Al a de hoy existen varias técnicas para reducir o eliminar el plástico después que ha sido
usado, una de ellas por ejemplo es la incineración, sin embargo, los desechos plásticos cuando
se incineran pueden liberar gases tóxicos y químicos que incluyen cloruro de hidrógeno,
dioxina, cadmio (Awasthi et al., 2017b). Otra estrategia para combatir este problema es la
conversión de plástico en energía, pero tiene sus propias desventajas, ya que provoca un
aumento de las emisiones netas de dióxido de carbono (Emadian et al., 2017).
Una estrategia interesante es la biodegradación del plástico, la cual varía según el tipo de
polímero, los aditivos químicos y la temperatura. Se han descrito varias enzimas que degradan
diferentes componentes del plástico sin embargo muchas de ellas tienen poca actividad. El
estudio de enzimas con actividad para degradar plástico se divide según qué tipo de componente
del plástico son capaces de degradar, por ejemplo, PETasas, poliuretanasas, etc (Patel et al.,
2022).
El poliuretano es un material plástico termoestable muy versátil y ampliamente utilizado en una
gran variedad de aplicaciones, como el revestimiento de muebles, la fabricación de espumas
para colchones y asientos de coche, y la producción de adhesivos y sellantes. Sin embargo, el
uso masivo de poliuretano ha llevado a una serie de problemas ambientales y de salud pública.
pág. 2950
Actualmente ya se tienen reportadas enzimas con capacidad degradadora de poliuretano (J. Liu
et al., 2021).
Para analizar y dilucidar el mecanismo de acción de una enzima es necesario conocer su estructura
3D para posteriormente usando ingeniería de proteínas, que a día de hoy están siendo más firmes
debido al aprendizaje automático o la inteligencia artificial, para mejorar su actividad a una escala
aplicable a procesos industriales. Lamentablemente para muchas de las enzimas que se han
reportado actividad degradadora de plástico no se tiene estructura cristalográfica, sin embargo,
es posible predecir esta estructura mediante programas bioinformáticos como AlphaFold,
TASER, entre otros (Laskowski et al., 1993).
La modelización de enzimas sin una estructura cristalográfica conocida es fundamental en la
investigación bioquímica moderna. AlphaFold ha revolucionado este campo al proporcionar
modelos precisos de proteínas, incluso cuando no se dispone de datos cristalográficos. Estas
predicciones son valiosas para comprender la estructura y la función de enzimas relevantes, como
aquellas implicadas en la degradación de polímeros como el poliuretano.
El proceso de docking molecular, utilizando estos modelos de enzimas generados por AlphaFold,
representa una herramienta esencial para explorar y predecir interacciones moleculares
específicas. En el contexto de este estudio, el objetivo fue evaluar si estas enzimas modeladas
tienen la capacidad de unirse y, potencialmente, catalizar la degradación del poliuretano.
Dado que las enzimas en cuestión carecían de una estructura cristalográfica conocida, el uso de
modelos generados por AlphaFold brindó una oportunidad única para abordar esta cuestión. El
docking molecular ofrece una vía efectiva para predecir y estudiar interacciones moleculares,
permitiendo así investigar la afinidad y la viabilidad de estas enzimas para interactuar con el
poliuretano, ofreciendo valiosas perspectivas para aplicaciones biotecnológicas y la comprensión
de la degradación de polímeros.
METODOLOGÍA
Población y muestra
La población de estudio estuvo constituida por todas las secuencias de proteínas depositadas en
la base de datos PubMed hasta la fecha de corte de este estudio. La muestra seleccionada para
pág. 2951
este estudio consistió en un conjunto representativo de secuencias de proteínas depositadas en
PubMed que han sido reportadas con actividad catalítica relacionada con poliuretanos. La
selección de la muestra se basó en una búsqueda exhaustiva utilizando términos clave pertinentes
y otros términos relacionados.
Diseño de investigación
El tipo de estudio del presente trabajo es: estudio básico. En él, manipulamos una variable
independiente (los modelos de enzimas generados por AlphaFold) para observar su efecto en la
interacción con el poliuretano, que sería la variable dependiente. El proceso de docking
molecular representa la herramienta o método utilizado para evaluar esta interacción específica
entre las enzimas y el poliuretano en un contexto controlado y sistemático.
El diseño de contrastación de hipótesis es descriptivo.
Hipótesis nula (H0): No existe una interacción significativa entre las enzimas modeladas por
AlphaFold y el poliuretano durante el proceso de docking molecular. En otras palabras, la
capacidad de las enzimas modeladas para unirse o interactuar con el poliuretano no difiere de lo
que se esperaría por azar o aleatoriamente.
Hipótesis alternativa (H1): Existe una interacción significativa entre las enzimas modeladas por
AlphaFold y el poliuretano durante el proceso de docking molecular. En este caso, se espera que
las enzimas mostradas por AlphaFold tengan la capacidad de unirse o interactuar específicamente
con el poliuretano, lo que sugiere una afinidad o potencial actividad catalítica hacia este sustrato.
Procedimiento
Recopilación de secuencias de proteínas
Se buscaron investigaciones que reportaran enzimas con actividad catalítica para poliuretanos.
Una vez obtenido su identificador, se accedió a NCBI y se buscó con la opción "protein", y se
descargó la secuencia de proteínas en formato "FASTA". Al archivo se le nombró con el código
GenBank para un mejor orden en el manejo de datos.
Caracterización de las propiedades fisicoquímicas de poliuretanasas, cutinasas y lipasas
Se llevaron a cabo determinaciones clave utilizando la herramienta Protparam
(https://web.expasy.org/protparam/). Se calculó el número de aminoácidos (NAA). El peso
pág. 2952
molecular (MW), el punto isoeléctrico (PI), el coeficiente de extinción (CE), la composición
de aminoácidos (aa), el tiempo de vida (TV) y el índice de inestabilidad (II), el índice alifático
(IA) y el valor de Gran Promedio de Hidropaticidad (GRAVY). Estos cálculos en Protparam
permitieron una caracterización detallada de las propiedades fisicoquímicas de las enzimas
estudiadas.
Alineamiento múltiple
Primero, las secuencias de las proteínas de interés, que incluyen cutinasas, poliuretanasas y
lipasas, se depositaron en la plataforma de Clustal Omega. Luego, se llevó a cabo un alineamiento
múltiple para todas las secuencias. Posteriormente, se realizaron alineamientos por separado para
cada grupo de proteínas, es decir, uno para las cutinasas, otro para las poliuretanasas y otro para
las lipasas. Para presentar de manera efectiva los resultados del alineamiento múltiple, se
empleó ESPript 3.0 (https://espript.ibcp.fr/ESPript/cgi- bin/ESPript.cgi).
Cladograma
Clustal Omega fue utilizado para la construcción de un cladograma que englobó tanto a todas
las proteínas en conjunto como a cada proteína de forma individual. Este enfoque de cladograma
proporcionó una visión global y detallada de la evolución de las proteínas estudiadas.
Predicción de motif
Para obtener una evaluación más precisa de la presencia de motivos en estas proteínas, se llevó
a cabo una búsqueda de motivos utilizando la herramienta MEME (https://meme-
suite.org/meme/tools/meme). MEME es capaz de descubrir motivos novedosos y sin brechas
(patrones recurrentes de longitud fija) en las secuencias de interés. Esta herramienta también
tiene la capacidad de dividir patrones de longitud variable en dos o más motivos separados.
Modelado molecular
La estructura de las enzimas encontradas se modeló computacionalmente empleando
ColabFoldAlphaFold2_advanced(https://colab.research.google.com/github/sokrypto
n/ColabFold/blob/main/beta/AlphaFold2_ advanced.ipynb), que utilizó el algoritmo MMseqs2
(Mirdita et al., 2021) para el alineamiento de secuencias múltiples (MSA).
pág. 2953
Evaluación del modelado molecular
El modelo final fue evaluado con la herramienta web Structural Analysis and Verification Server
(SAVES) (https://saves.mbi.ucla.edu/) para obtener y analizar el factor de calidad global
utilizando el programa ERRAT (Colovos & Yeates, 1993). Además, se analizó el gráfico de
Ramachandran del paquete PROCHECK (Laskowski et al., 1993), que mostró el porcentaje de
residuos dentro de sus regiones favorecidas, lo cual fue útil para analizar y detectar posibles
impedimentos estéricos. Por último, se realizaron alineaciones estructurales y figuras utilizando
el software PyMOL (The PyMOL Molecular Graphics System, Version 1.8 Schrodinger, LLC,
New York, NY, USA).
Docking Molecular
Para el estudio de acoplamiento molecular se hizo uso del servidor web de PubChem
(C22H36N2O8) con un peso molecular de 456.5 unidades de masa atómica (UMA). Para el
análisis, se utilizaron los mejores modelos predichos por Alphafold. El servidor CB-Dock
(Cavity-detection guided Blind Docking) (http://clab.labshare.cn/cb-dock/php/index.php) es capaz
de predecir los sitios de unión en una proteína dada y calcular sus centros y tamaños utilizando
un innovador enfoque de detección de cavidades basado en la curvatura (Y. Liu et al., 2020, 2022).
RESULTADOS
Se obtuvo un total de 29 secuencias de aminoácidos de la base de datos PubMed. De estas
secuencias, 7 de ellas fueron identificadas como poliuretanasas, 15 como cutinasas y 7 como
lipasas (Tabla 1).
Tabla 1 Tabla general de secuencias de GenBank
NOMBRE [ORGANISMO]
GENBANK
POLYURETHANASE
Polyurethanase [Pseudomonas sp. HS6]
WP_249486220.1
Polyurethanase [Pseudomonas sp. HS6]
UQS16381.1
Polyurethanase [Pseudomonas sp. HS6]
WP_249486221.1
Polyurethanase [Pseudomonas sp. HS6]
UQS16382.1
Polyurethanase [Pseud omonachlororaphis
subsp. piscium]
UQS88382.1
pág. 2954
Polyurethanase [Pseudomonaschlororaphis
subsp. piscium]
UQS88381.1
Polyurethanase [Pseudomonas marginalis]
WP_154841285.1
CUTINASE
Cutinase [Pyrenopeziza brassicae]
CAB40372.1
Cutinase [Drepanopezi za brunnea f. sp.
'multigermtubi'MB_m1]
XP_0072910 87.1
Cutinase [Drepanopezi za brunnea f. sp.
'multigermtubi'MB_m1]
EKD18956.1
Cutinase [Rhizoctonia solani AG-1 IB]
CCO31306.1
Cutinase [Rhizoctonia solani AG-1 IB]
CCO34480.1
Cutinase [Rhizoctonia solani AG-1 IB]
CCO36642.1
Cutinase [Fusarium solani]
AAA33334.1
Cutinase [Diplocarpon rosae]
PBP23319.1
Cutinase [Diplocarpon rosae]
PBP15993.1
Cutinase [Diplocarpon rosae]
PBP26284.1
Cutinase [Diplocarpon rosae]
PBP28852.1
Cutinase [Diplocarpon rosae]
PBP21072.1
Cutinase [Diplocarpon rosae]
PBP17513.1
Cutinase [Talaromyces islandicus]
CRG87219.1
Cutinase [Phytophthor a capsici]
CAA61622.1
LIPASE
Lipase [Colletotrichum chlorophyti]
OLN86975.1
Lipase [Colletotrichum fructicola]
KAF4430836.1
Lipase [Trifolium pratense]
PNY15192.1
Lipase [Trifolium pratense]
PNY07848.1
Lipase [Trifolium pratense]
PNY15257.1
Lipase [Scenedesmus sp. PABB004]
KAF8065798.1
Lipase [Scenedesmus sp. PABB004]
KAF8063011.1
Se construyó un cladograma usando Clustal Omega, se puede observar como todas las
secuencias se agrupan en 3 ramas principales (Figura 2), en la primera rama encontramos 6
lipasas y 1 cutinasa, en la segunda rama 7 poliuretanasas y 1 lipasa, y en la tercera rama todas
son cutinasas.
pág. 2955
Figura 1 Cladograma general
Poliuretanasas
Obtuvimos un total de 7 secuencias, las cuales fueron analizadas como se detalla a continuación.
Predicción de motif
Se realizó una búsqueda de los motif en MEME, que mostró 3 posibles motif consensus para las
poliuretanasas (Figura 2).
Figura 2 Predicción y cálculo de motif en poliuretanasas
Modelamiento en Alphafold
Así pues, se continuó con el modelado de las proteínas usando AlphFold Colab que para las
poliuretanasas fueron un total de 7 secuencias. AlphaFold para cada secuencia dio como resultado
5 modelos, de los cuales después de analizar su estructura secundaria predicha, fueron
seleccionados aquellos con mejor puntuación pLDDT (per-residue local distance difference test).
En las poliuretanasas la secuencia que mostró un mejor score pLDDT fue WP_249486220.1 con
pág. 2956
un score de 93.5 y la menor fue WP_154841285.1 con un score de 89.78 (Figura 3).
Figura 3 Comparación entre modelos coloreados según score
Para estos modelos predichos, todos tenían una estructura tridimensional similar con algunas
pequeñas variaciones. Los modelos se muestran en la Figura 4, en la cual cada modelo fue
coloreado siguiendo el espectro visible, la proteína con mejor puntuación estando en morado
hasta la de menor puntuación estando en rojo.
Figura 4 Estructura tridimensional de las poliuretanasas modeladas
Docking molecular
Se obtuvo que WP_249486220.1 y UQS16381.1 tuvieron una buena puntuación Vina, y esto se
podría correlacionar con que también fueron las secuencias que obtuvieron las mejores
puntuaciones de predicción en AlphaFold, así pues, la secuencia WP_154841285.1 que fue la que
obtuvo predicción más baja de AlphaFold, también obtuvo la puntuación Vina más baja de las
poliuretanasas.