CELLO – Automação de design de circuitos genéticos.

Circuito de programação para biologia sintética

À medida que as técnicas de biologia sintética se tornam mais poderosas, os pesquisadores estão antecipando um futuro em que o projeto de circuitos biológicos será semelhante ao projeto de circuitos integrados em eletrônica. Nielsen et al. descreve o que é essencialmente uma linguagem de programação para projetar circuitos computacionais em células vivas. Os circuitos gerados nos plasmídeos expressos em Escherichia coli requeriam isolamento cuidadoso de seu contexto genético, mas funcionavam primariamente conforme especificado. Os circuitos poderiam, por exemplo, regular as funções celulares em resposta a múltiplos sinais ambientais. Tal estratégia pode facilitar o desenvolvimento de circuitos mais complexos por engenharia genética.

 

 

http://www.cellocad.org

Resumo estruturado

INTRODUÇÃO

As células respondem ao ambiente, tomam decisões, constroem estruturas e coordenam tarefas. Subjacentes a esses processos estão operações computacionais realizadas por redes de proteínas reguladoras que integram sinais e controlam o tempo de expressão gênica. Aproveitar essa capacidade é fundamental para projetos de biotecnologia que exigem tomada de decisões, controle, detecção ou organização espacial. Foi demonstrado que as células podem ser programadas usando circuitos genéticos sintéticos compostos de reguladores organizados para gerar uma operação desejada. No entanto, a construção de circuitos simples é demorada e pouco confiável.

JUSTIFICATIVA

A automação de projeto eletrônico (EDA) foi desenvolvida para auxiliar os engenheiros no projeto de eletrônicos baseados em semicondutores. Em um esforço para acelerar o projeto de circuitos genéticos, aplicamos princípios da EDA para permitir o aumento da complexidade do circuito e simplificar a incorporação da regulação gênica sintética em projetos de engenharia genética. Usamos a linguagem de descrição de hardware Verilog para permitir que um usuário descreva uma função de circuito. O usuário também especifica os sensores, os atuadores e o “arquivo de restrições do usuário” (UCF), que define o organismo, a tecnologia do gate e as condições operacionais válidas. Violoncelo ( www.cellocad.org) usa essa informação para projetar automaticamente uma seqüência de DNA que codifica o circuito desejado. Isso é feito por meio de um conjunto de algoritmos que analisam o texto Verilog, criam o diagrama de circuito, atribuem portas, equilibram restrições para construir o DNA e simulam o desempenho.

RESULTADOS

O violoncelo desenha circuitos desenhando uma biblioteca de portas lógicas booleanas. Aqui, a tecnologia de gate consiste de lógica NOT / NOR baseada em repressores. A conexão do gate é simplificada definindo os sinais de entrada e saída como fluxos de RNA polimerase (RNAP). Descobrimos que os portões precisam ser isolados de seu contexto genético para funcionar de forma confiável no contexto de diferentes circuitos. Cada porta é isolada usando terminadores fortes para bloquear o vazamento de RNAP, e a permutabilidade de entrada é melhorada usando ribozimas e espaçadores de promotores. Essas peças são variadas para cada porta para evitar quebras devido à recombinação. Medir a carga de cada porta e incorporar isso nos algoritmos de otimização reduz ainda mais a pressão evolutiva.

O violoncelo foi aplicado ao projeto de 60 circuitos para Escherichia coli , onde a função do circuito foi especificada usando o código Verilog e transformada em uma seqüência de DNA. As sequências de DNA foram construídas conforme especificado sem ajuste adicional, exigindo 880.000 pares de bases de montagem de DNA. Destes, 45 circuitos foram executados corretamente em cada estado de saída (até 10 reguladores e 55 partes). Em todos os circuitos, 92% dos 412 estados de saída funcionaram como previsto.

CONCLUSÃO

Nosso trabalho constitui uma linguagem de descrição de hardware para programação de células vivas. Isso exigiu o codesenvolvimento de algoritmos de design com portas que são suficientemente simples e robustas para serem conectadas por algoritmos automatizados. Demonstramos que os princípios de engenharia podem ser aplicados para identificar e suprimir erros que complicam as composições de sistemas maiores. Essa abordagem leva a uma genética altamente repetitiva e modular, em contraste com a codificação de redes regulatórias naturais. O uso de uma linguagem independente de hardware e a criação de UCFs adicionais permitirão que um único design seja transformado em DNA para diferentes organismos, terminais genéticos, condições de operação e tecnologias de gate.

 

 

Programação genética usando violoncelo.

Um usuário especifica a função de circuito desejada no código Verilog, e isso é transformado em uma sequência de DNA. Um circuito de exemplo é mostrado (0xF6); as curvas vermelha e azul são estados de saída preditos para populações de células, e as distribuições de preto sólido são dados de citometria de fluxo experimental. As saídas são mostradas para todas as combinações de estados do sensor; sinais de mais e menos indicam a presença ou ausência de sinal de entrada. RBS, local de ligao ao ribossoma; RPU, unidade promotora relativa; YFP, proteína fluorescente amarela

.Fig. 1 Visão geral do violoncelo.

A ) Usuários de violoncelo escrevem código Verilog e selecionam ou carregam sensores e um UCF. Com base no design do Verilog, uma tabela de verdade é construída a partir da qual um diagrama de circuito é sintetizado. Reguladores são atribuídos a partir de uma biblioteca para cada porta (cada cor é um repressor diferente). O desenho combinatório é então usado para concatenar partes em uma sequência de DNA linear. O SBOL Visual ( 101 ) é usado para os símbolos das peças. Flechas levantadas são promotores, círculos em hastes são isolantes de ribozimas, hemisférios são ERBs, setas grandes são seqüências codificadoras de proteínas e “T” s são terminadores. As cores das peças correspondem aos portões físicos. ( B) A especificação física para a UCF Eco1C1G1T1. O circuito e os sensores são inseridos em um plasmídeo; o outro plasmídeo contém o promotor de saída do circuito, que pode ser usado para dirigir a expressão de uma proteína fluorescente ou outro atuador. Ambos os plasmídeos devem estar presentes na cepa especificada para que o projeto seja válido.

 

Fig. 2 Atribuição de portões genéticos ao diagrama de circuito.

A ) Um conjunto de quatro portas baseadas em diferentes repressores (cores) conectados em várias permutações para construir diferentes funções de circuito. As entradas (A, B e C) são promotores de entrada do sensor; o promotor de saída do circuito (X) controla o gene de atuação. ( B ) As formas das funções de resposta da porta determinam se elas podem ser conectadas funcionalmente. O portão laranja (PhlF) tem um grande alcance dinâmico (linhas tracejadas) que atravessa o limiar do portão roxo (BetI). No entanto, na ordem inversa, os portões não se conectam funcionalmente. ( C) As relações combinatórias dos repressores da biblioteca de portas isoladas são mostradas nas posições a montante (porta A) e a jusante (porta B). A escala de cores à direita indica a mudança relativa (normalizada), calculada como a faixa máxima de saída que pode ser alcançada conectando a porta A ao gate B. Os números indicam diferentes RBSs. Os gráficos da esquerda e da direita mostram quando a porta A regula a posição 1 e a posição 2, respectivamente. Portões que são excluídos da posição 2 por causa do roadblock são mostrados em preto (fig. S9). ( D ) A probabilidade de encontrar um circuito funcional versus o número de portas lógicas. A probabilidade de um circuito funcional é definida como a probabilidade de uma atribuição aleatória passar na análise do limiar de entrada (fig. S31) e não possuir combinações de roadblocking. ( E) A convergência do algoritmo de atribuição de porta de recozimento simulado (fig. S28). Inserções de gráfico de barras: as barras pretas devem estar LIGADAS; as barras cinzas devem estar DESLIGADAS; o eixo y é a saída no RPU em uma escala de log e o eixo x é o estado de entrada (da esquerda para a direita: 000, 001, 010, 011, 110, 101, 110, 111). A pontuação do circuito ( S ) é definida como a razão entre o estado ON previsto mais baixo e o estado OFF previsto mais alto (fig. S26 e eq. S2). Um exemplo de pesquisa é mostrado para o diagrama de circuito nas inserções; as cores correspondem aos repressores atribuídos a cada porta ( Fig. 3B ).

Entradas correspondem à ausência ou presença de IPTG 1 mM (direita – / +) e aTc (2 ng / ml; esquerda – / +) ( 84 ). (B ) As arquiteturas dos portões isolados. Algumas portas têm várias versões com diferentes seqüências RBS. As seqüências de DNA do gate são fornecidas na tabela S8. ( C ) Um exemplo de uma função de resposta para uma porta NOT baseada no repressor PhlF. A mudança no limite para os três RBSs é mostrada. Os dados para todas as portas isoladas são mostrados na fig. S4 ( D ) O impacto de cada porta no crescimento celular como uma função da sua atividade de promotor de entrada. O crescimento celular foi medido como OD 600 e normalizada pelo crescimento do controlo não indutor de 6 horas após a indução ( 84 ). Os quatro portais que reduziram o crescimento em> 20% estão indicados. Barras de erro são um SD de crescimento celular normalizado [ eixo y em (D)] e a mediana [eixo y em (A) e (C); eixo x em (C) e (D)] para três experiências independentes realizadas no mesmo dia.

 

Continua em: http://science.sciencemag.org/content/352/6281/aac7341