CENTRO UNIVERSITÁRIO FEEVALE

 

 

 

 

 

 

KLAUS KELLER

 

 

 

 

APLICAÇÃO DE ALGORITMOS DE BIOLOGIA COMPUTACIONAL NA VERIFICAÇÃO DE SIMILARIDADE EM TRANSCRIÇÕES GREGAS NEOTESTAMENTÁRIAS

 

 

 

 

 

 

 

Novo Hamburgo, Novembro de 2005.


KLAUS KELLER

 

 

 

 

 

 

 

APLICAÇÃO DE ALGORITMOS DE BIOLOGIA COMPUTACIONAL NA VERIFICAÇÃO DE SIMILARIDADE EM TRANSCRIÇÕES GREGAS NEOTESTAMENTÁRIAS

 

 

 

Centro Universitário Feevale

Instituto de Ciências Exatas e Tecnológicas

Curso de Ciência da Computação

Trabalho de conclusão de curso

 

 

 

Professor Orientador: Ricardo Ferreira de Oliveira

Novo Hamburgo, Novembro de 2005.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Agradecimentos

A Deus criador e mantenedor de todas as coisas.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

“Passará o céu e a terra, mas as minhas palavras jamais passarão”.

 

Lucas 21:33

 

 

 

 

RESUMO

O Novo Testamento foi copiado à mão, em papiro e pergaminho durante um período de quase 1500 anos, e como conseqüência disso, existem mais de 5000 manuscritos conhecidos que podem ser fragmentos e até Bíblias inteiras que posteriormente tiveram seu número de cópias multiplicado, a partir da invenção da imprensa de Gutenberg. Essa atividade de cópia manual, por mais cuidadosa que fosse, estava sujeita a erros que foram legados às suas cópias e assim sucessivamente gerando um conjunto grande de cópias com diversas diferenças acrescidas ainda da deterioração dos manuscritos por manuseio ou armazenagem inadequados.

Diversos trabalhos foram realizados na intenção de recuperar o texto original. Esta atividade foi denominada Crítica Textual, que também começou sendo feita manualmente em meados do século XIX e atualmente pode ser contemplada também por diversas técnicas de estatística e algoritmos pela tecnologia da informação.

A bioinformática é um ramo da ciência que, entre outros, desenvolve algoritmos que buscam similaridades em comparações de cadeias de DNA. Estes algoritmos podem também ser utilizados em seqüências de letras ou números, podendo, desta forma, também ser aplicáveis, em combinação com técnicas de estatística multivariada, à tarefa de comparar transcrições gregas do Novo Testamento.

Desta forma, com esses recursos busca-se uma alternativa adicional aos diversos trabalhos desenvolvidos na área da crítica textual que tem por objetivo geral a busca de similaridade com a aplicação de algoritmos usados na comparação de cadeias de DNA. Atividade que será desenvolvida na busca de algoritmos utilizados nas similaridades em comparação de cadeias de DNA que sejam aplicáveis às matrizes de transcrições gregas.


Palavras chaves: Novo Testamento, Crítica Textual, Manuscritos, Biologia Computacional, Similaridade, Seqüências, Alinhamento.


ABSTRACT

The New Testament was copied and handwritten on papyrus and on parchment during a period of almost 1500 years and, as the result there are more than 5000 manuscripts known and may be fragments and even whole Bibles that were afterwards accepted by the Guttenberg press. This way of manually copying was subject to mistakes that were passed to its copies and so on generating a large group of copies with many differences with the addition of the deterioration of the manuscripts through mishandling or inappropriate storage.

Several attempts were done with the intention of recuperating the original text. This activity is called textual critic, and also had its beginning done manually in the mid-century XlX and can currently be seen also by several ways of statistics and algorithms by the information technology.

The bioinformatics is a part of Science that, among others, develops algorithms that look for similarities in comparisons of chains of DNA. These algorithms can also be used in sequences of letters or numbers, being this way also applicable in combinations of techniques of statistics of multi-variations to the task of comparing Greek transcriptions of the Old Testament.

This way with these recourses an additional alternative is searched to the several works developed in the area of textual critics with the general objective the search of similarity with the application of algorithms used in the comparison of the chains of DNA. Activity that will be developed in the search of algorithms utilized in the similarities in comparison of chains of DNA that are applicable to the matrices of Greek transcriptions.

Key words: New Testament, Textual Critic, Manuscripts, Computational  Biology, Similarity, Sequences, Alignment.   




LISTA DE ABREVIATURAS

 

DNA – Desoxi Ribo Nucleic Acid

RNA – Ribo Nucleic Acid

ASC – American Standard Code for Information Interchange

 

 

 

 



SUMÁRIO

SUMÁRIO.. 10

INTRODUÇÃO.. 14

1. O problema: versões diferentes e classificações. 19

1.1. ALTERAÇÕES INVOLUNTÁRIAS. 21

1.1.1. Visão Deficiente. 21

1.1.2. Erros de homoioteleuton. 21

1.1.3. Audição Deficiente. 21

1.1.4. Erros de Memória. 22

1.1.5. Erros de Julgamento. 22

1.2. ALTERAÇÕES VOLUNTÁRIAS. 22

1.2.2. Correções Harmonizadoras. 23

1.2.3. Acréscimos. 23

1.2.4. Duplicidade de Textos. 24

1.2.5. Alterações Feitas por Questões Doutrinárias. 24

2. RESTAURAÇÃO DO TEXTO.. 26

2.1. O PERÍODO PRÉ-CRÍTICO.. 27

2.2. O PERÍODO CRÍTICO MODERNO.. 27

2.3. O PERÍODO CONTEMPORÂNEO.. 28

3. FAMILIAS DE MANUSCRITOS. 30

3.1. Texto Alexandrino.. 32

3.2 Texto Bizantino.. 33

3.3. Texto Cesareense.. 33

3.2. Texto Ocidental.. 33

3.4. Texto Neutro.. 34

3.6. Texto Siríaco.. 34

4. alinhamento de sequências. 36

4.1. ALINHAMENTO GLOBAL (Needleman-Wunch) 39

4.1.1. Algoritmo de Programação Dinâmica. 40

4.1.2. Funcionamento do Algoritmo de Programação Dinâmica. 41

4.1.3. Regras de Pontuação. 41

4.1.4 Regras Adicionais de Pontuação. 42

4.1.5. Formula da regra recursiva. 43

4.2. Alinhamento Múltiplo.. 45

5. aplicação dos algoritmos da biologia nos textos gregos. 47

5.1. Similaridades e distinções entre as transcrições e o DNA.. 48

5.1.1. Inserção de conteúdo não pertencente ao original. 49

5.1.2. Deleção de conteúdo pertencente ao original. 49

5.1.3. Alteração de conteúdo pertencente ao original. 49

5.2. OS TEXTOS GREGOS. 50

5.2.1. A Seleção dos Textos. 53

5.2.2. A Filtragem dos Textos. 54

5.3. A alteração e aplicação dO Algoritmo dE alinhamento global em perl   55

5.3.1. Ponto de partida. 55

5.3.2. Remoção das tags. 56

5.3.3. A Escolha da fonte. 56

5.3.4. Abertura de Arquivo. 56

5.3.5. Falta de Memória. 57

5.3.6. Alinhamento Reverso. 58

5.3.7. Alinhamento de Palavras Distintas. 59

5.3.8. Pré-processamento. 61

5.3.8. Retirada dos Caracteres de Controle. 62

5.3.9. Amostragem do Resultado. 63

5.3.10. Exemplo de Amostragem do Resultado. 63

5.4. A testagem dO Algoritmo.. 64

5.4.1. Hebreus 1:1. 64

5.4.2. Hebreus 1:7. 65

5.4.3. Hebreus 1:9. 65

5.4.4. Hebreus 1:10. 66

5.4.5. Hebreus 1:10. 67

5.4.6. Hebreus 1:14. 67

5.4.7. Hebreus 2:5. 68

5.4.8. Hebreus 2:17. 69

5.5. resultados da testagem... 69

Conclusão.. 73

6. Referências bibliográficas. 75

Anexos. 78


INTRODUÇÃO

  Pesquisas em crescimento na atualidade são a crítica textual na área da religião e a Biologia computacional na ciência. Desta forma, aliar as tecnologias de pesquisa da biologia computacional à crítica textual moderna, que vem sendo defrontada por diversas teorias, é objeto fascinante de estudo e pesquisa.

A informação relacionada à biologia computacional tem apresentado um crescimento exponencial entre 1965 e 1995, o que deixa claro o crescimento em aplicações e pesquisas nessa área. A figura abaixo representa o crescimento de diversos tipos de informação relacionados à biologia computacional.

 

 

Ilustração 1: Crescimento da Informação da Bioinformática

Fonte: (GEIGER, 2005)

 

Há 50 anos, no dia 7 de março de 1953, no laboratório Cavendish, na Inglaterra, Francis Crick e James Watson concluíram que a molécula do DNA tem a estrutura de uma dupla hélice (MOREIRA, 2005). Esta descoberta daria novos rumos à ciência, ou seja: a partir de então, a biologia molecular tornou-se, de fato, uma ciência que hoje, com meio século de avanços, traz ela à cena a transgênese, a genômica e a possibilidade da clonagem reprodutiva e tem vínculo forte com a informática.

Existem poucos trabalhos exaustivos auxiliados por computador no sentido de recuperar o conteúdo exato dos manuscritos gregos do Novo Testamento. Provavelmente isso se deve ao fato da complexidade dessa atividade, acrescida da necessidade do alto grau de conhecimento exigido nas línguas e culturas Grega, Hebraica, Romana e Latina, contemporâneas aos manuscritos existentes atualmente (APOLINÁRIO, 2005).

Encontram-se arquivados em diversos museus 5000 manuscritos contendo partes ou todos os livros do Novo Testamento, entre eles está o fragmento mais antigo proveniente da biblioteca de John Rylands, em Manchester, Inglaterra. Contém o texto do evangelho segundo João 18:31-33, 37 e 38, que foi escrito no Egito, na primeira metade do II século, menos de 50 anos depois da morte de João (METZGER, 1969).

Manuscritos como este, são de suma importância no intento de recuperação do texto original, devido ao seu caráter, que é variável em cada um dos 5000 existentes podendo ser classificados, por exemplo, como mais confiáveis de acordo com caráter idade e origem (APOLINÁRIO, 2005).

A grande quantidade de manuscritos remanescentes é antitética[1] por si mesma, pelo fato de ser ao mesmo tempo argumento de comprovação da autenticidade por similaridade e motivo entrave à possibilidade de resgate do conteúdo original (APOLINÁRIO, 2005).

As alterações encontradas nesses manuscritos são obra da falibilidade característica do ser humano, que são classificadas por Meztger (METZGER, 1969, p. 186-206) em diversas categorias:

-Visão e audição deficientes.

-Homoioteleuton (acréscimo ou supressão de partes devido a terminarem na linha com a mesma palavra).

-Erro de memória (o amanuense[2] lê e lembra diferente do que leu ao escrever), isto é quando o amanuense escreve o texto na cópia, ao reescrever não escreve exatamente como estava no original por lembrar diferente do que realmente está escrito.

-Erros de julgamento (amanuense considera parte do texto uma nota explicativa do amanuense anterior), ou vice-verso.

-Correções de gramática, estilo, ortografia ou harmonizadoras.

-Alterações feitas por questões doutrinárias.

Em suma as alterações a serem consideradas são basicamente três: inserção, exclusão e alteração.

 A atividade na intenção de recuperar o texto original extraído destas alterações é de extrema importância para a humanidade tendo em vista a proeminência da Bíblia como patrimônio da fé humana.

 Essa atividade é baseada nestes manuscritos remanescentes que amanuenses antigos legaram à contemporaneidade deu origem à Crítica Textual. No século XIX Karl Lachmann segundo Bruce Metzger teria sido precursor da crítica textual aplicando os critérios utilizados na revisão dos textos gregos clássicos nos textos Bíblicos. Tornando-se, em conseqüência disto, o primeiro contestador da versão tida como mais aceita e utilizada na sua época e ainda hoje, o Textus Receptus[3]. Muitos têm, contudo argumentado de que essa tarefa não é totalmente possível, o que em certos aspectos é real. (METZGER, 1969).

Conseq üentemente, a tarefa de recuperar o conteúdo original não é plenamente contemplada neste trabalho devido à sua complexidade e conforme afirmado acima, à impossibilidade em certos aspectos de sua execução.

O escopo deste trabalho restringe-se dentro do possível em adicionar os algoritmos de análise de seqüências, amplamente aplicados atualmente na bioinformática nas comparações de seqüências de textos gregos do novo testamento.

Biologia computacional é também chamada de bioinformática, apesar de muitos praticantes definirem bioinformática como algo limitado por restringir-se somente ao campo da biologia molecular (Geiger, 2005).

Segundo Setúbal, desde que a estrutura do DNA foi descoberta em 1953, a biologia molecular tem presenciado grandes avanços. Com o desenvolvimento de técnicas de manipulação de seqüência biomolecular, uma enorme quantidade de dados foi gerada. (SETÚBAL, 1997, p.09).

Por outro lado, Gusfield ressalta que as informações relacionadas à biologia celular podem ser representadas por cadeias de textos contendo letras. Deste modo, Gusfield relaciona a biologia molecular à representação de seqüências (GUSFIELD, 1997, p. 13).  

Tompa, por sua vez complementa que quando um genoma, que é uma seqüência biomolecular, é mapeado a primeira tarefa é identificar os genes e hipotetizar a respeito de suas funções. Hipotetizar sua funções é tarefa geralmente executada utilizando se de algoritmos de similaridade seqüencial (TOMPA, 2000).

Visto que as alterações textuais já mencionadas podem ser basicamente três (exclusão, inserção e alteração), é plenamente razoável considerar que a busca similaridade seqüencial de DNA apresenta características perfeitamente aplicáveis às transcrições visto que segundo Shamir estas são as mesmas diferenças encontradas entre seqüências de DNA. (SHAMIR, 2001).

Especificamente este trabalho pretende aplicar os algoritmos de alinhamento de seqüências da bioinformática nas matrizes de transcrições gregas neo-testamentárias do livro de Hebreus do Novo Testamento ou em seus capítulos iniciais.

 Essas transcrições são cópias digitalizadas transliteradas em letras latinas fiéis a manuscritos originais que contem também elementos explicativos das diversas situações encontradas nesses manuscritos. 

Poucos trabalhos baseiam-se nessa idéia, talvez somente Avishai Yorav  manifestou tal intento tendo concluído que essa aplicação mecanizada apresentou  resultados similares aos obtidos pelos métodos tradicionais provando assim serem úteis aos filologistas  no sentido de recuperar o texto na intenção do seu autor, defendendo que os algoritmos da filogenia[4] tem o mesmo propósito que a filologia[5] (YORAV, 2005).

1. O problema: versões diferentes e classificações

A tarefa da crítica textual tem origem no fato de que não há sequer um remanescente dos documentos originais que são denominados de autógrafos (GUNDRY, 1989, p.64).

 Durante um período de quase 1500 anos o Novo Testamento foi copiado à mão em papiro[6] e pergaminho[7], isto produziu cerca de 5500 manuscritos espalhados em museus e bibliotecas. Os documentos vão desde fragmentos de papiro até Bíblias inteiras em grego, produzidas a partir da invenção da imprensa. Seus estados de conservação são tão variáveis quanto possível (APOLINÁRIO, 2005).

 

 

 

Ilustração 2: Exemplo de Manuscrito

Fonte: http://www-user.uni-bremen.de

 

Nem todos os manuscritos concordam entre si. Essas variações requerem uma avaliação cuidadosa para determinar o que ao autor realmente escreveu (APOLINÁRIO, 2005).

Atualmente a transmissão e cópia de textos ou arquivos digitais podem ser consideradas como exatas. Documentos digitais preservam com exatidão seu conteúdo original a menos que sejam intencionalmente alterados. Essa talvez seja uma das inumeráveis vantagens da tecnologia atual.

Contudo, antes  do advento da imprensa no século XV, a transmissão de qualquer escrito só era possível se feita à mão palavra por palavra (APOLINÁRIO, 2005).

Manuscritos, diferentemente de arquivos digitais, são resultados de transcrições de amanuenses sujeitos a diversos tipos de erros agrupados em dois grandes grupos:

1.1. ALTERAÇÕES INVOLUNTÁRIAS

1.1.1. Visão Deficiente

O escriba[8] atingido por qualquer problema de visão, encontrava dificuldade em distinguir as letras gregas semelhantes, especialmente se o amanuense[9] anterior escreveu relaxadamente.   Então em um manuscrito uncial[10] onde a letra sigma fosse lunar, era fácil confundi-lo com a letra épsilon,  teta ou ómicron (METZGER,1969, p. 186).

Lambdas escritos muito próximos podem ser tomados por Mi, isso ocorre em Romanos 6:5, em diversos manuscritos está alla cuja tradução é “porém” (TAYLOR, 1995, p. 16), em outros está ama que significa  “juntos” (TAYLOR, 1995, p. 17).

1.1.2. Erros de homoioteleuton

Tecnicamente, este erro chama-se “homoioteleuton[11], que significa final igual de duas linhas. (METZGER, 1969, p. 186)

Isto esclarece João 17:15 no Códice Vaticano, onde não aparecem as palavras aqui colocadas entre parênteses: "Não peço que os tires do (mundo, mas que os livres do) mal".

Freqüentemente a mesma palavra ou grupo de palavras era copiada duas vezes. Em Atos 19:34 a expressão: “Grande é a Diana dos Efésios”, aparece duas vezes do Códice Vaticano. Chama-se ditografia a repetição daquilo que ocorre apenas uma vez e haplografia a falta da repetição de uma letra ou palavra (APOLINÁRIO, 2005).

1.1.3. Audição Deficiente

 Era comum ditarem ao amanuense e ele escrever uma outra palavra parecida, como as nossas expressões imersão e emersão, despercebido e desapercebido, comprimento e cumprimento.

Outro problema com o ditado encontra-se nas homônimas[12] não homógrafas[13], como ilustram as palavras portuguesas: sinto e cinto, incipiente e insipiente, cocho e coxo.

A confusão entre épsilon e eta, ômega e ómicron eram muito comuns em ditados. Um problema desta natureza está em Romanos. 5:1, onde a variante tenhamos se alterna com temos, em grego ekwnen e econen (METZGER,1969, p. 190).

1.1.4. Erros de Memória

 Estes erros surgiram porque a memória falhava enquanto o amanuense olhava para o manuscrito e procurava escrever o que lá se encontrava (METZGER, 1969, p. 192).

Um exemplo de troca de palavras é Mateus 19:16-17, onde alguns amanuenses alteraram o relato para que este concordasse com Marcos 10:17 e Lucas 18:18.

Na declaração de Colossenses 1:14 diversos amanuenses adicionaram em alguns manuscritos, "através do seu sangue", por influência da passagem paralela de Efésios 1:7.

1.1.5. Erros de Julgamento

 Existem alguns erros que apenas podem ser explicados por culpa de amanuenses pouco inteligentes ou descuidados. Palavras ou notas explicativas, encontradas na margem, eram muitas vezes, incorporadas ao texto, ou vice versa (METZGER, 1969, p. 192).

1.2. ALTERAÇÕES VOLUNTÁRIAS

Paradoxalmente escribas conscienciosos eram potencialmente mais perigosos do que aqueles que se limitavam a copiar o que tinham diante de si. Muitas das alterações, que podem ser classificadas como intencionais foram, sem dúvida, introduzidas de boa fé por amanuenses que criam estar corrigindo erros ou infelicidades de linguagem, que se haviam introduzido no texto sagrado e precisavam ser retificados (METZGER, 1969, p. 195).

A despeito da vigilância de eclesiásticos zelosos, alguns escribas, chocados com erros reais ou imaginários, de ortografia, gramática e fatos históricos, deliberadamente, introduziram mudanças no que estavam copiando (METZGER, 1969, p. 195).

1.2.1. Correções de Gramática, Ortografia e Estilo.

 O livro de Apocalipse, com seus freqüentes semitismos[14] e solecismos[15], ofereceu muitas oportunidades aos escribas, de correção gramatical (METZGER, 1969, p. 196).

Para melhorar a sintaxe do nominativo depois da preposição apo (Apocalipse 1:4), os escribas inseriram tou, Qeou ou Kurinon  [16](TAYLOR, 1995, p. 28).

1.2.2. Correções Harmonizadoras

 Intencionalmente ou não, procurando harmonizar passagens paralelas ou relatos idênticos, os amanuenses alteravam algumas passagens (METZGER, 1969, p. 197).

Por exemplo:

Em João 19:20 encontra-se a expressão – Jesus Nazareno, o Rei dos Judeus, estava escrito em hebraico, latim e grego. Em muitos manuscritos, os amanuenses acrescentaram no texto de Lucas 23:38, isto foi escrito em hebraico, latim e grego.

A forma mais curta da Oração do Senhor em Lucas 11:2-4  foi alterada, em muitas cópias, para concordar com a forma mais familiar e mais longa encontrada em Mateus 6:9-13.

1.2.3. Acréscimos

 Acréscimos feitos na margem ou em notas no rodapé, uma vez ou outra eram introduzidos para o texto (METZGER, 1969, p. 198).

Colossenses 1:23 ilustra como  amanuenses realçaram a dignidade do Apóstolo Paulo. Neste verso Paulo diz que ele se tornou ministro do Evangelho, "diácono". Sendo que a palavra grega "diácono" significa, literalmente, aquele que serve (TAYLOR, 1995, p. 55). Ministro passou a designar uma ordem inferior do ministério, isto é, aqueles que executam trabalhos mais simples na Igreja; os amanuenses dos manuscritos alefe a e P mudaram diáconos para querix e apóstolos, por acharem que estes títulos eram mais apropriados ao Apóstolo Paulo. O manuscrito A traz os três títulos para Paulo – arauto, apóstolo e ministro (APOLINÁRIO, 2005, 2005).

1.2.4. Duplicidade de Textos

 O que faria um amanuense ao ver que a mesma passagem fora dada diferentemente em dois ou mais manuscritos? Em vez de fazer uma escolha entre as duas variantes (com a probabilidade de omitir a genuína), muitos incorporaram as duas na mesma cópia que estavam transcrevendo. Isto produziu a duplicidade de textos ou de leituras, característica dominante da família bizantina (METZGER, 1969, p. 199).

Por exemplo: A afirmação de Lucas de que os discípulos estavam ininterruptamente no templo bendizendo a Deus aparece em diversos manuscritos, "estavam continuamente no templo orando a Deus". Muitos amanuenses concluíram que era mais seguro transcrever as duas declarações: "estavam continuamente no templo orando e bendizendo a Deus".

Em At. 20:28 diz em alguns manuscritos: "Igreja de Deus", e em outros: "Igreja do Senhor". Muitos manuscritos posteriores aglomeraram: "Igreja do Senhor e Deus".

1.2.5. Alterações Feitas por Questões Doutrinárias

Irineu, Clemente de Alexandria, Tertuliano, Eusébio e muitos outros Pais da Igreja acusaram os hereges[17] de corromperem as Escrituras para apoiarem suas  próprias convicções (METZGER, 1969, p.201). Por exemplo, Márcion tirou do Evangelho de Lucas todas as referências judaicas relacionadas com Jesus. A Harmonia dos Evangelhos de Taciano traz várias alterações textuais para apoiar suas opiniões ascéticas.

Os manuscritos do Novo Testamento preservam traços de duas espécies de alterações dogmáticas: as que envolvem eliminação ou alteração do que era considerado doutrinariamente inaceitável ou inconveniente e as que introduziram dentro das Escrituras "provas" para uma prática ou um dogma teológico (METZGER, 1969, p.201).

Os exemplos são muitos, como podem ser vistos em The Text of the New Testament, página 202 e 203, mas destes apenas um será transcrito: Escribas que não podiam harmonizar a declaração de Jesus de Mateus 24:36 e Marcos 13:32 "que Ele não sabia o dia da sua vinda", com a sua divindade, omitiam a expressão: "nem o Filho". (METZGER, 1969, p.201).

A partir desse ponto pode-se ter compreensão da importância dos manuscritos mais antigos ainda que fragmentados aliados à numerosa quantidade de manuscritos distintos.

É possível que se argumente que essas exposições são ofensivas, contudo prefere-se acreditar que a ciência no poder das evidencias tem capacidade cada vez maior de trazer à tona a verdade, e ainda mais, com o auxílio da tecnologia e da informática, com métodos corretos e fontes seguras (APOLINÁRIO, 2005).

Então a restauração de textos recebe proeminência visto que muito tem a ser feito nessa área no sentido da dar mais credibilidade aos céticos quanto à origem e  unidade dos textos bíblicos.

A abordagem da restauração de textos nesse trabalho é abreviada nesse trabalho devido ao escopo deste.

 

2. RESTAURAÇÃO DO TEXTO

A crítica textual estabelece, através da investigação das cópias distintas, qual texto que deveria ser o mais aproximado do original, ou seja, executa, conforme a figura abaixo, uma árvore em busca do arquétipo que seria o mais aproximado do possível original. Em certos casos, as evidências estavam tão perfeitamente classificadas, que se tornava difícil decidir entre duas variantes. Em outras situações, o crítico poderia tomar uma decisão baseada em razões mais exatas que o levam a preferir uma variante em detrimento de outra (METZGER, 1969, p.207).

Ilustração 3: Árvore em busca do arquétipo.

Fonte: http://www.katapi.org.uk/BibleMSS/II.htm

Os nomes mais conhecidos dessa atividade são: Kurt Aland, Johann Albrecht Bengel, Richard Bentley, John W. Burgon, A. C. Clark, Desiderius Erasmus, Robert Estienne (Stephanus), Arthur L. Farstad, John Fell, Caspar René Gregory, Johann Jakob Griesbach, J. Rendel Harris, Fenton John Anthony Hort, A. E. Housman, Karl Lachmann, Eberhard Nestle, Erwin Nestle, F. H. A. Scrivener, Johann Salomo Semler, Stephanus: see Robert Estienne, Constantine von Tischendorf, Samuel Prideaux Tregelles, Hermann Freiherr von Soden, Brooke Foss Westcott, Johann Jakob Wettstein, Francisco Ximénes de Cisneros (Elliott, 2005).

Todos têm importante papel na crítica textual o escopo deste trabalho restringe-se contudo ao relato dos mais conhecidos.

O resumo da atuação desses nomes  faz parte do conteúdo de “The Encyclopedia of New Testament Textual Criticism” (Elliott, 2005).

 

 

2.1. O PERÍODO PRÉ-CRÍTICO

Durante os séculos XVII e XVIII, muitos eruditos recolheram grande quantidade de informações sobre muitos manuscritos gregos, assim como das versões antigas e dos Pais Apostólicos (METZGER, 1969, p.95).

2.2. O PERÍODO CRÍTICO MODERNO

No início do século XIX, Karl Lachmann se aplicou os critérios que havia utilizado na revisão de textos gregos clássicos. Lachmann foi o primeiro erudito que se reconhece haver-se apartado totalmente do Texto Receptus. Ele demonstrou, por comparação de manuscritos, como estes podiam retroceder até seus arquétipos perdidos e inferir sua condição e paginação. (Anglada, 2005), (METZGER, 1969, p.119).

Lobegott Friedrich Constantin V. Tischendorf (1815 - 1874): Este erudito investigou e publicou mais manuscritos e produziu maior número de edições críticas da Bíblia grega que nenhum outro (Elliott, 2005).

Samuel Prideaux Tregelles: Na Inglaterra, foi Samuel Prideaux Tregelles o erudito que em meados do século XIX teve mais êxito em afastar a preferência grega pelo Texto Receptus (Elliott, 2005). Quando tinha ainda vinte anos, Tregelles começou a fazer planos para uma edição crítica do Novo Testamento. Sem sabê-lo, Tregelles desenvolveu com simultaneidade assombrosa, princípios de crítica paralelos aos de Lachmann.

 

B. F. Westcott (1825-1901) e J. A. Hort (1828-1892): O ano de 1881 tem um significado especial pela publicação da mais notável edição crítica do Testamento Grega jamais produzida. Depois de 28 anos de trabalho, B. F. Westcott (1825-1901) e J. A. Hort (1828-1892), ambos professores de Teologia em Cambridge, produziram dois volumes intitulados O Novo Testamento em Grego Original (Elliott, 2005). Ao contrário de revisores anteriores, nem Westcott nem Hort se prenderam à comparação de manuscritos, nem tão pouco proveram um aparato crítico. Mas, utilizando coleções de variantes textuais prévias, aperfeiçoaram a metodologia crítica desenvolvida por Griesbach, Lachmann e outros, e a aplicaram rigorosamente, porém com discriminação, aos testemunhos do Novo Testamento.

H. Von Soden; A. Merck; J. Bover; E. Nestle; S. Legs; R. Tasker: O texto do Novo Testamento prosseguiu seu processo de restauração mediante a aplicação da ciência da crítica textual, através de extensos e pacientes trabalhos realizados por A. Souter; H. Von Soden; A. Merck; J. Bover; E. Nestle; S. Legs; R. Tasker e muitos outros (Elliott,2005), acerca dos quais não é possível escrever agora. De igual forma estes foram ajudados por importantes descobertas de novos manuscritos gregos realizadas na primeira metade do século XX, que permitiram lançar maior luz na restauração do texto bíblico.

2.3. O PERÍODO CONTEMPORÂNEO

Contemporaneamente há alternativas mais diversificadas e exatas para auxiliar a crítica textual. As ferramentas mais promissoras talvez sejam oriundas da informática que se desenvolveu de forma inesperada e tem agora potencial de realização promissor em praticamente todas as áreas da ciência moderna. Como por exemplo, o mapeamento do genoma humano, com a tecnologia de algumas décadas atrás esse processo era praticamente impossível de ser levado à cabo, mas com as ferramentas da atualidade isso foi  completado (TERRA, 2005).

 

A digitalização dos manuscritos remanescentes abre portas para um amplo e inédito desenvolvimento da crítica textual, que agora de posse dessas tecnologias, não necessita mais de amanuenses e nem de consultas aos papiros e pergaminhos, apenas necessita das regras da crítica textual e das transcrições dos manuscritos em arquivos que podem ser trabalhados por programas de computador.

As novas possibilidades já favoreceram estímulo para algumas raras implementações e aplicações técnicas avançadas de crítica textual e informática, como o trabalho de Timothy John Finney (FINNEY, 2005)  que é bem voltado à recuperação do texto na intenção do seu autor, e outras aplicando técnicas estatísticas como a de Wieland Willker (WILKER, 2005) ou ainda o artigo de J. C. Thorpe (THORPE, 2005). Entretanto poucas tem sido exaustivas dentro das possibilidades que a documentação remanescente permite, e é até mesmo é plausível afirmar que na verdade são raras as implementações que tem esse intuito de exaustivamente trabalhar no sentido de aplicar a crítica textual auxiliada pela informática.

Possivelmente o trabalho que mais se assemelha a esse propósito, é o trabalho de Avishai Yorav (YORAV, 2005) que defende o uso dos algoritmos de filogenia na filologia no intento de com  os manuscritos remanescentes proceder a stemática  que possibilite o vislumbre de um possível arquétipo, apesar das inúmeras divergências encontradas nos manuscritos restantes, tendo feito uso para isso, do algoritmo de filogenia de  parcimônia mista do software PHYLIP 6.5 (FELSENSTEIN, 2005).

As atividades de Thorpe e Wilker são de um estágio mais adiantado que presume-se já estejam de posse das relações de variações contidas entre os manuscritos e trabalham com esses dados, já Finney tem um escopo mais ampliado que vem desde a descoberta das variações à classificação dos manuscritos.

Na intenção de facilitar o trabalho dos críticos os  manuscritos existentes foram classificados em famílias  cuja  descrição se dá abaixo.

3. FAMILIAS DE MANUSCRITOS

Para auxiliar a sua leitura, os manuscritos foram dispostos em grupos ou famílias, considerando-se as características semelhantes ou diferentes que apresentavam.

O objetivo desta classificação era descobrir os manuscritos mais antigos, porque mais se deveriam assemelhar aos originais. O precursor da classificação em famílias, ou do método genealógico foi o erudito alemão Karl Lachmann (1793-1851), que ensinou o seguinte princípio: o melhor método para descobrir o texto bíblico é traçar sua árvore genealógica através da qual  se atinge seu arquétipo.(Anglada, 2005).

Esse trabalho é importante, pois a partir do momento que se tem toda a transcrição dos manuscritos remanescentes, é muito interessante comparar as transcrições com as classificações realizadas por esses ícones da crítica textual.

Destas classificações em famílias, a de Westcott e Hort é uma das mais conhecidas e discutidas.(Anglada, 2005).

 

 

 

 

 

A seguinte tabela mostra manuscritos dentro das suas classificações por tipo de texto e por conteúdo:

Tabela 1: Classificação dos manuscritos

Tipo de Texto

Evangelhos

Atos

Cartas de Paulo

Católicas

Apocalipse

Alexandrino

P66 P75+B+T Aleph+Z C L (X) D (Mark) Xi(Y) 33 579 892 1241 2427 sa bo

P74 AlephA B C 33 81 1175 vg? sa bo

AlephA C I (P) 33 81 (104) (436) 442 1175 (1241supp) 1506* 1962 fam 2127 2464 bo

P72+B AlephA+33+436 Y 81 vg sa bo

A C vg 1006 2050 2053 2062 2344? bo

Bizantino

(A) E F G H K M (N) (P) (Q) S U V Y G L S F 047

(E) H L P Y 049 056 0142 1241

K L (Y) 049 056 0142 (33 1175 2464 em Romanos)

K L 049 056 0142
(1175 nas Joaninas)

MK: 046 429 522 2138
MA: P 051 1 181

Cezareense

Q f1 f13 22 28(Mk) 565 700 arm geo

 

 

 

 

Ocidental

D Old Latin Syrsin? Syrcur?

D (E) Syrhark-marg saG67

D F G Velha Latina (r não) (629) (goth)

 

 

P46/B

 

 

P13 P46 B sa

 

 

P47/Aleph

 

 

 

 

P47 Aleph2344?

Família 1739

 

1739 630 945 1891 2200 2298

1739 0243/0121b 0121a 6 424c 1881 (630 in Romanos-Galatas)

C 1241 1739 6 322 323 945 1881 2298 1243+2492?

 

Família 2138

 

614+2412 383? 1505+2495 1611 2138 Syrhark

1505+2495 1611 Syrhark 2005? (1022)

614+2412 630+1799+2200 1505+2495 1611 2138 Syrhark 206 429 522 1799

 

Família 330

 

 

330+451 2492

 

 

 

Adaptado de: (ELLIOT, 2005)

3.1. Texto Alexandrino

Também formado por pequeno grupo de manuscritos que não puderam ser colocados nas outras classes por eles apresentadas.

Westcott e Hort o denominaram de Neutro, e Von Soden de H (Hesiquiano). O grupo consta especialmente dos manuscritos: alef, B, P 75 e 33.

Como o nome indica, teve a sua origem no Egito, na famosa cidade de Alexandria, um dos principais centros de cultura na antiguidade. É o produto da mais aprimorada e minuciosa recensão[18] já efetuada no texto bíblico. Este trabalho foi dirigido por Hesíquio, com uma técnica bastante adiantada (APOLINÁRIO, 2005).

Ilustração 4: Codex Alexandrinus - 5º Século

Fonte : http://www.katapi.org.uk

 

 

3.2 Texto Bizantino

É conhecido como Asiático por Bengel, Constantinopolitano por Griesbach, Siríaco, por W. H., oriental por Semler e K por Von Soden (APOLINÁRIO, 2005).

O chefe da recensão deste tipo de texto foi Luciano. O principal objetivo desta recensão foi fundir passagens paralelas para que nada se perdesse do texto sagrado e aclarar o texto, fazendo com que passagens difíceis se tornassem mais fáceis. Este é o texto da grande quantidade de unciais e cursivos. Nele está baseado o Novo Testamento de Erasmo, o Textus Receptus e todas as edições do Novo Testamento anteriores à de W. H. em 1881. Dentre seus unciais destacam-se A, E, L, F e o W. O texto Bizantino tem sido classificado pelos entendidos como bastante deficiente (ELLIOT, 2005).

3.3. Texto Cesareense

A crítica textual comprova sua origem no Egito. Cesareense vem da circunstância de ser o tipo de texto usado em Cesaréia [19].

O manuscrito padrão deste grupo é o Coridete ou B. Apresentam características semelhantes ao Coridete as Famílias 1 e 13 dos minúsculos (ELLIOT,2005).

3.2. Texto Ocidental

Recebe este nome por ser representado pelo códice Beza, Greco-latino D, e pela velha Versão Latina e porque suas mais influentes evidências são predominantemente latinas. Tem como característica preponderante divergir das outras famílias.

São seus principais representantes: D, DP, F, P29, P48, 171, Velha Latina.

A Crítica Textual verificando a falta de homogeneidade do Texto Ocidental supõe que nele não se foi aplicada nenhuma recensão.

Ao contrário do siríaco, neste grupo se encontra um pequeno grupo de manuscritos, sendo liderado pelo Códice Beza ou D fazem também parte dele antigas traduções latinas e de Pais da Igreja latinos, como Cipriano, Irineu e Tertuliano (ELLIOT, 2005).

3.4. Texto Neutro

Para Westcott e Hort, sob este nome se encontram os dois principais manuscritos, isto é, o alef e o B.

Conforme conceito destes eruditos, era o melhor texto por ser o mais primitivo e ter sido transmitido com pureza de forma. Denominaram-no de Neutro por não se desviar na direção seguida pelos outros grupos. (Anglada, 2005)

3.6. Texto Siríaco

O nome siríaco deriva-se da conclusão de que na Síria, provavelmente em Antioquia[20], uma revisão textual se processou durante a primeira metade do 4º século. Esta revisão se fez necessária, porque o texto já apresentava muitas variantes e a Igreja prezava pela uniformidade nas Escrituras.

Neste grupo está a maioria dos manuscritos gregos do Novo Testamento, sendo muitos unciais do V século e quase todos os minúsculos.

O agrupamento de manuscritos em famílias simplificou bastante o trabalho da Crítica Textual, que não se baseia mais no número de manuscritos, mas no número de famílias e suas características predominantes. É muito mais fácil e apresenta melhores resultados consultar cinco manuscritos de famílias diferentes do que uma centena pertencente à mesma família (ELLIOT, 2005).

O alinhamento de seqüências é a técnica que pretende ser testada para verificar sua usabilidade nos manuscritos bíblicos, pode ser aplicado na comprovação ou reprovação das classificações em famílias, é uma etapa bem primordial para a finalidade de analisar a similaridade de seqüências. 

4. alinhamento de sequências

Os algoritmos da Biologia Computacional têm sido desenvolvidos e aplicados com intensidade inédita nos meios da ciência atual no interesse de desvendar os genomas das espécies.

Isto pode ser percebido pelo crescimento exponencial das bibliografias, fato já mencionado acima.

Alinhamento de seqüências é o processo de comparar duas  ou mais seqüências pela procura de séries de caracteres individuais, ou padrões de seqüências de caracteres que estão na mesma ordem nas seqüências. Duas seqüências estão alinhadas ao serem escritas numa página em duas linhas, quando caracteres similares ou análogos são arranjados na mesma coluna, e caracteres não análogos são por sua vez posicionados na coluna de origem considerados como lacuna divergente ou oposta na outra seqüência. Em um alinhamento otimizado caracteres não idênticos e lacunas são colocados de forma a permitir caracteres idênticos ou similares tantos quanto possíveis nos registros verticais. Seqüências que podem ser alinhadas desta forma são consideradas similares (MOUNT, 2005, p.54).

Existem três tipos de alinhamento de seqüências, global, local e múltiplo. No alinhamento global (Needleman, S. and Wunsch, C. 1970) a tentativa é feita no sentido de alinhar duas seqüências em toda sua extensão, usando tantos caracteres quanto possível até o fim das duas seqüências. Seqüências que são totalmente ou aproximadamente similares são possíveis candidatas ao alinhamento global.

No alinhamento local (Smith, T.F. and Waterman, M. S. 1981) trechos de seqüência com maior concentração de combinações são alinhados, gerando desta forma uma ou mais ilhas de combinações ou sub-alinhamentos no alinhamento de seqüências. O alinhamento local é mais indicado para seqüências que são similares em algumas partes e distintas em outras seqüências que diferem em tamanho.

No alinhamento múltiplo (MOUNT, 2005, p.140), mais de duas seqüências são alinhadas na busca de agrupamentos que são as similaridades maiores entre as colunas  de todas as seqüências consideradas.

As similaridades de seqüências consideradas são as de DNA, RNA ou seqüências de aminoácidos que são as aplicadas com mais freqüência na biologia computacional. Sua utilidade é predicada na suposição que um grau elevado de similaridade entre duas seqüências e implica freqüentemente a função similar e/ou a estrutura tridimensional.

Os problemas e os algoritmos de similaridade de seqüência são razoavelmente simples.  Isto monta um contexto de concordância com relação à linguagem utilizada para discutir e computar algoritmos.  Para começar esse processo, o algoritmo significa simplesmente um método especificado para resolver um problema.  Neste contexto, um algoritmo pode ser pensado como um programa de computador, embora os algoritmos sejam expressos geralmente em uma língua um tanto mais abstrata do que linguagens de programação reais.

Segundo Martim Tompa, desde que um genoma esteja completamente seqüenciado, diversas análises de seqüências podem ser efetuadas para identificar os genes, determinar a função de cada gene (uma forma de determinar a função é hipotetizando a partir de outro gene cuja similaridade é grande e a sua função é conhecida, isto pressupõe que a similaridade de seqüências implica em similaridade de funções o que pode não ser verdade), identificar as proteínas envolvidas na regulagem da expressão do gene, identificar as repetições de  seqüências  e identificar outras regiões funcionais (TOMPA, 2005).

Muitas destas tarefas são de natureza computacional.  Dada a incrível taxa em que os dados de seqüências estão sendo produzidos, as integrações da informática, da matemática e da biologia serão integrais a analisar as seqüências.

O alinhamento de seqüências é freqüentemente descrito em termos de edição de distancia ou similaridade. Essas noções são opostas e permutáveis. Na edição da distância a pontuação é incrementada como o numero de mudanças requeridas para transformar uma seqüência de forma que seja mais similar à outra, então uma pontuação baixa indica uma similaridade mais forte entre as seqüências. A similaridade parte do princípio de que quanto mais caracteres combinarem entre as duas seqüências (sem alteração da ordem) maior será o valor positivo do alinhamento.

 

Ilustração 5: DNA

Fonte: (CRICK, F. H.C. e WATSON, J. D. , 1953)

 

 

 

 

4.1. ALINHAMENTO GLOBAL (Needleman-Wunch)

 

O algoritmo de alinhamento global é um dentre os usados na biologia computacional que tem como alvo calcular a similaridade em toda a extensão de duas seqüências de DNA dadas por meio de programação dinâmica.

Esse trabalho foi inicialmente desenvolvido por Saul B. Needleman e Christian D. Wunsch em 1970, dando referencia aos demais algoritmos de sequenciamento genético, ou seja o alinhamento múltiplo e o alinhamento com lacunas.

    Needleman e Wunsch (Needleman, S. and Wunsch, C. 1970), e posteriormente Sankoff e Sellers (Sankoff 1972; Sankoff and Cedergren 1973) propuseram a aplicação deste algoritmo ao caso particular das seqüências biológicas. Na sua abordagem, a pontuação correspondente ao melhor alinhamento e o maior de todos. Os dois métodos permitem alinhar de forma ótima duas seqüências (o algoritmo e freqüentemente chamado de NWS). Em seguida apresenta-se uma matriz definida de acordo com o algoritmo inicial de NWS. Uma vez que na literatura, e nos programas disponíveis, ambas as formas são freqüentes, e importante verificar qual das implementações está  sendo utilizada.

À medida que se constrói a matriz, guarda-se em cada célula um ponteiro direcionado para a célula que esteve na sua origem da sua pontuação.

 

4.1.1. Algoritmo de Programação Dinâmica

Para se encontrar um alinhamento entre duas seqüências de DNA, a técnica mais utilizada é baseada no algoritmo de programação dinâmica. Esta técnica busca o melhor alinhamento entre duas seqüências de caracteres. Ela se baseia na construção de uma matriz de comparação de prefixos das duas seqüências a serem alinhadas. Ao tentar alinhar sucessivamente os prefixos, o algoritmo atribui um valor de pontuação para cada um dos prefixos. O valor de pontuação é calculado de forma a penalizar as diferenças entre os prefixos e privilegiar as similaridades (GEIGER, 2005).

Por exemplo, dadas duas seqüências S1 = TACCA e S2 = AGA, um possível alinhamento entre S1 e S2 seria:

S1) TACCA

S2) _AG_A

Para alinhar S1 e S2, foi preciso inserir espaços para que o alinhamento fizesse sentido, produzindo um efeito negativo no valor de pontuação total do alinhamento. Este alinhamento também produziu um alinhamento de dois caracteres diferentes ao alinhar C com G na terceira posição. Assim como lacunas, o alinhamento de caracteres diferentes também produz um efeito negativo sobre o valor de pontuação do alinhamento. Existem extensões do algoritmo de programação dinâmica que introduzem alguns conceitos que aproximam mais os resultados da realidade biológica.

Um exemplo é a penalização por abertura de lacunas. Nessa extensão do algoritmo, é dada prioridade à ocorrência de lacunas unidas. Isso é justificado pelo fato de ser muito mais fácil ocorrer uma mutação que acrescente ‘n’ genes ao mesmo tempo do que uma mutação que acrescente ‘n’ genes disjuntos em tempos diferentes. Para exemplificar, entre os seguintes alinhamentos, teoricamente o segundo é muito mais plausível biologicamente:

Alinhamento 1:

Seqüência A: ACCGTTA

Seqüência B: A_C_T_A

Alinhamento 2:

Seqüência A: ACCGTTA

Seqüência B: AC___TA.

  A complexidade de tempo do algoritmo de programação dinâmica puro para comparação de duas seqüências é n² com relação ao tamanho das seqüências. É possível generalizar o algoritmo para que ele resolva o alinhamento para um número ‘n’ fixo de seqüências. Contudo, a complexidade exponencial de memória e processamento torna a aplicação do algoritmo impraticável neste caso.

 

4.1.2. Funcionamento do Algoritmo de Programação Dinâmica

O funcionamento do algoritmo de alinhamento global ou algoritmo de Needleman-Wunch se dá da seguinte forma (NEEDLEMAN, S. E WUNSH, C. 1970):

Dadas as entradas de duas seqüências a serem alinhadas dá-se a saída que seria o alinhamento mais adequado a essas duas seqüências, considerando inicialmente que o algoritmo não trabalha com lacunas nas seqüências de entrada.

 Então sendo AGC a primeira seqüência (T) de entrada e AAAC a segunda seqüência dada (S) deseja-se saber dentre os possíveis alinhamentos qual o mais adequado às seqüências dadas

4.1.3. Regras de Pontuação

Existem três elementos a serem considerados na busca do melhor alinhamento entre duas seqüências :

-Combinações Perfeitas

-Diferenças

-Inserções e deleções

O processo de descoberta do melhor alinhamento inicia-se a partir da definição de regras para cada uma dessas situações dadas, essas regras referem-se à pontuação que será aplicada à  cada ocorrência das situações anteriormente mencionadas (GEIGER, 2005).

Um exemplo hipotético de regras poderia ser:

-Combinações receberiam pontuação positiva (+1).

-Diferenças receberiam pontuação negativa (-1).

- Inserções e deleções receberiam pontuação negativas maiores (-2).

Os valores dados acima são freqüentemente dados arbitraria e relativamente ao seu contexto, pois algumas mudanças podem ser mais plausíveis que outras, então podem ser adotados valores mais adequados à situação aplicada.

 

4.1.4 Regras Adicionais de Pontuação

Após terem sido definidos os valores de pontuação para as situações de combinações, diferenças, inserções e exclusões é necessário definir as funções de pontuação que farão uso desses valores para dar prosseguimento à busca do melhor alinhamento que será calculado em um vetor bi-dimensional (V) cujas dimensões são respectivamente representações das seqüências a serem comparadas (GEIGER, 2005).

Dessa forma o preenchimento inicial do vetor se dá a partir das penalidades atribuídas às lacunas ou deleções então:

Tabela 2: Preenchimento inicial do Vetor de alinhamento (V)

 

 T

A

G

C

 S

0

-2

-4

-6

A

-2

 

 

 

A

-4

 

 

 

A

-6

 

 

 

C

-8

 

 

 

Adaptado de: (GEIGER, 2005)

 

Para dar seqüência ao preenchimento do vetor (V) sendo i linhas, e j colunas suas dimensões, será executado o seguinte processo:

4.1.5. Fórmula da regra recursiva

Sendo V[1,1] a próxima célula a ser calculada, o valor será obtido através da fórmula de regra recursiva (TOMPA, 2000, p.24):

V( i , j ) = Max(  V( i-1,j-1 ) + σ( S[i],T[j] ) , V( i-1,j ) + σ( S[i],- ) , V( i,j-1 ) + σ( -,T[j] ) )

Esse procedimento será executado em toda a extensão da matriz até que ela esteja totalmente preenchida:

Tabela 3: Preenchimento total do Vetor de alinhamento (V)

 

T

A

G

C

S

0

-2

-4

-6

A

-2

1

-1

-3

A

-4

-1

0

-2

A

-6

-3

-2

-1

C

-8

-5

-4

-1

 

Adaptado de: (GEIGER, 2005)

A partir desse ponto é possível buscar o melhor alinhamento utilizando o mesmo principio do preenchimento da matriz, isto é buscando sempre o maior valor, serão recuperados os valores que na regra recursiva maximizaram a pontuação da matriz (TOMPA, 2005, p. 25):

Tabela 4: Busca do melhor alinhamento em (V)

 

T

A

G

C

S

0

-2

-4

-6

A

-2

1

-1

-3

A

-4

-1

0

-2

A

-6

-3

-2

-1

C

-8

-5

-4

-1

Adaptado de: (GEIGER, 2005)

O melhor alinhamento é traçado diagonalmente na matriz sempre pelos valores maiores, caso haja valores superiores verticalmente acima ou horizontalmente no caso à esquerda então ocorre o desvio que será caracterizado  pela inserção de um espaço (TOMPA, 2005, p. 25).

Dessa forma é obtido em um primeiro momento o alinhamento AAAC = AG-C que é considerado o melhor alinhamento.

Contudo a situação peculiar dessas permite diversos alinhamentos com a mesma pontuação.

 

4.2. Alinhamento Múltiplo

Um alinhamento de seqüências de DNA ou proteínas de diferentes espécies de seres vivos é uma hipótese de homologia entre as bases (ou nucleotídeos) que constituem os genes (ou proteínas) sendo comparados naqueles seres vivos.

Encontrar um bom alinhamento entre as seqüências de várias espécies é geralmente uma tarefa difícil e envolve vários problemas. A similaridade pode ser alta em certos trechos das seqüências e baixa em outras partes. As seqüências podem ser de tamanhos variados ou muito diferentes entre si.

A maioria das técnicas de alinhamento múltiplo deriva do algoritmo de programação dinâmica utilizado no alinhamento global.

Quando se pretende caracterizar uma família de seqüências que partilham uma mesma atividade biológica, a utilização de alinhamentos de seqüências duas a duas não é satisfatória, pois não providencia uma comparação do conjunto das seqüências. Pode haver interesse nesta visão global de um conjunto de seqüências por diversas razões, de entre as quais duas se destacam: i) as seqüências têm uma história evolutiva comum e a partir delas pode-se estudar a história evolutiva das espécies respectivas; ii) as seqüências estão relacionadas por uma razão de ordem funcional ou estrutural e o estudo das suas semelhanças permite acrescentar novas informações sobre elas (TOMPA, 2005, p. 33).

O alinhamento múltiplo foi uma das primeiras respostas a estes tipos de problemas e ainda continua a ser a abordagem dominante, pelo menos no que se refere ao estudo da filogenia (GUPTA S. K., KECECIOGLU J.D., AND SCHAFFER A.A. 1995). O algoritmo de programação dinâmica descrito precedentemente para alinhamento global é facilmente generalizável ao alinhamento de diversas seqüências (KRUSKAL AND SANKOFF, 1983). No entanto, o tempo e a memória necessários para a sua execução cresce em LN (L sendo o comprimento característico das seqüências). Para valores típicos de L de 1000, este tipo de abordagem torna-se assim muito rapidamente impraticável. Três algoritmos têm sido utilizados:

-Algoritmos baseados no alinhamento progressivo dois a dois das seqüências;

-Algoritmos que constroem um alinhamento global baseados em alinhamentos locais;

-Algoritmos que constroem alinhamentos locais múltiplos.

O detalhamento desses processos não fará parte do escopo desse trabalho.

A aplicação e suas implicações são abordados nos próximos capítulos.

5. aplicação dos algoritmos da biologia nos textos gregos.

A proposta essencial desse trabalho é mostrar que há possibilidade de aplicar os algoritmos de biologia computacional nas transcrições gregas do novo testamento devido às similaridades existentes entre as duas situações, ou seja, basicamente pode ser afirmado que as transcrições gregas do novo testamento e o DNA possuem similaridades e por isso é possível aplicar esses algoritmos neste propósito diferenciado.

Os algoritmos mais indicados para essa aplicação são os algoritmos de alinhamento múltiplo de seqüências visto que como, por exemplo, 33 transcrições do livro de hebreus são utilizadas no trabalho de Timothy John Finney (FINNEY, 2005), é razoável concluir que um algoritmo de alinhamento de seqüências como o proposto por Needleman e Wunsch (Needleman, S. and Wunsch, C. 1970), e posteriormente revisto por Sankoff e Sellers (Sankoff 1972; Sankoff and Cedergren 1973), atende a proposta de comparação entre dois textos, contudo para uma conclusão mais apurada o alinhamento global não é satisfatório visto que para uma análise completa é necessário comparar todas as 33 transcrições entre si.

Essa é mais precisamente a proposta dos algoritmos de alinhamento múltiplo de seqüências que foram aqui somente introduzidos.

 As conseqüências da aplicação dos algoritmos da biologia computacional nas transcrições gregas podem ser diversas:

-Determinação da afiliação de determinado manuscrito dentro das famílias citadas verificando a similaridade entre este e o trecho equivalente do texto das famílias citadas, por exemplo, pode ser verificado se o manuscrito P 75 realmente pertence ao grupo de manuscritos da família Alexandrina conforme a classificação atualmente aceita e citada anteriormente, bem como pose ser feita a verificação de similaridade deste manuscrito com as outras famílias desta forma pode se verificar se não existe um grau de similaridade superior, identificando assim uma falha na classificação atualmente conhecida.

-Determinação do grau de similaridade entre manuscritos distintos sem, contudo desejar a classificação destes nas usuais famílias.

-Comprovação se realmente as famílias estão corretamente classificadas aplicando os algoritmos na integra dos manuscritos e adicionando ainda técnicas de Estatística Multivariada sobre os resultados das comparações para ver que famílias são formadas. Este talvez seja o objetivo completo que caiba dentro do escopo total desse assunto.

5.1. Similaridades e distinções entre as transcrições e o DNA

Assim como o DNA as transcrições gregas do Novo Testamento são seqüências de caracteres nessa situação a distinção mais evidente é que as seqüências de DNA são compostas de apenas quatro letras em toda sua extensão, enquanto as transcrições gregas são compostas de todo o alfabeto grego e ainda sinais de pontuação e números, ou seja, a variação possivelmente pode ser considerada, estatisticamente muito maior.

Outro ponto que deve ser considerado é que no caso das transcrições gregas, dependendo da situação dos manuscritos em questão, a ocorrência de lacunas é muito grande, onde ocorreu à deterioração do papiro ou pergaminho transcrito dessa forma o tratamento de lacunas deve ser aprimorado, além do mais, a presença ou não dependendo do manuscrito dos espaços entre as palavras que não podem ser tratados como lacunas.

As similaridades mais evidentes a serem consideradas são as características das diferenças entre os textos, ou seja, um texto difere de outro basicamente por poderem ter sido inferidas sobre esse, três operações que alteram seu conteúdo original.

Como visto diversas situações implicam em alterações nos manuscritos, mas todas podem ser classificadas em três macro-categorias:

5.1.1. Inserção de conteúdo não pertencente ao original.

Essas ocorrências podem ser originadas de “homoiteleuton”, de imprudência do amanuense que adiciona ao texto observações do amanuense anterior, que são os erros por falha de julgamento, mencionados acima. Notas explicativas e explicações geográficas podem ser encaixadas aqui.

5.1.2. Deleção de conteúdo pertencente ao original.

Essas ocorrências podem ser originadas também de “homoiteleuton” onde o amanuense pula uma linha julgando já a ter copiado por ter a mesma terminação de uma copiada anteriormente, de imprudência do amanuense que considera como parte do texto observações do amanuense anterior, que são os erros por falha de julgamento, mencionados acima. Aqui também podem ser encaixados erros intencionais diversos

5.1.3. Alteração de conteúdo pertencente ao original.

Essas ocorrências podem ser originadas de diversas das situações mencionadas neste trabalho nas paginas 17 a 21.

Conclusivamente essas classificações podem variar de acordo com o tipo da sua ocorrência, que podem ser percebidas nas observações das comparações, contudo as ocorrências provocam somente essas alterações nos textos, sendo que não são considerados aqui os problemas oriundos do estado de conservação dos manuscritos no momento da sua transcrição.

 

 

5.2. OS TEXTOS GREGOS

Os textos gregos a serem utilizados são os mesmos utilizados por Timothy John Finney em sua tese de doutorado. A escolha desses textos se deu em virtude de já terem sido aplicados em algoritmos, e também por serem o conjunto mais completo de um mesmo livro encontrados em arquivos de computador. São compostos por 32 transcrições de manuscritos diferentes que podem ser usadas livremente.

É importante salientar que essas transcrições estão restritas ao livro de Hebreus em virtude da aplicação das mesmas, dessa forma entende-se que os manuscritos originais podem conter mais que o livro de hebreus e com freqüência possuem todo o Novo Testamento, entretanto podem ter também apenas partes do livro de hebreus, isto está exemplificado na primeira tabela desse trabalho e é esclarecido na tese de Finney:

“A careful examination of these references yields the following catalogue of papyrus and uncial manuscripts that cover Hebrews: P12, P13, P17, P46, P79, P89, U1, U2, U3, U4, U6, U15, U18, U20, U25, U44, U48, U56, U75, U122, U142, U150, U151, U227, U228, U243, U252, U278, U280, and U285. The process by which this list was compiled was not as straightforward as this summary indicates. Some manuscripts were only added as a result of information obtained at the Institute for New Testament Textual Research in Münster, Germany.” (FINNEY, 2005)[21]

 

Essas transcrições possuem características que devem ser tratadas antes de serem submetidas ao alinhamento de seqüências. Como já mencionado anteriormente, os textos possuem marcações referentes a situações que ocorrem nos mesmos. Outro ponto que deve ser considerado é que os textos são transcrições o que significa que não estão utilizando suas letras gregas convencionais, mas sim as letras latinas substituídas de acordo com o esquema abaixo, de transliteração, estabelecido pelo autor da tese.

 

Tabela 5: Esquema de Transliteração dos Textos Gregos

Letra

Uncial

Minúscula

Numero

Alpha

A

A

1

Beta

B

B

2

Gamma

G

G

3

Delta

D

D

4

Epsilon

E

E

5

Waw (digamma)

-

-

6

Zeta

Z

Z

7

Eta

H

H

8

Theta

Q

Q

9

Iota

I

I

10

Kappa

K

K

20

Lambda

L

L

30

Um

M

M

40

Nu

N

N

50

Xi

X

X

60

Omicron

O

O

70

Pi

P

P

80

Koppa

-

-

90

Rho

R

R

100

Sigma

S

S

200

Tau

T

T

300

Upsilon

U

U

400

Phi

F

F

500

Chi

C

C

600

Psi

Y

Y

700

Omega

W

W

800

Sampi

-

-

900

Adaptado de: (FINNEY, 2005)

 

As marca ções mencionadas referem se as ocorrências de rasuras correções, e outras ocorrências oriundas dos processos de cópia dos textos executadas pelos amanuenses.

 

[ut]...[/ut] uncertain text: could be one of a handful of letters

[rt]...[/rt] reconstructed text: missing, or could be any letter

[st]...[/st] superscript text: allows isolation for line length counts

[it]...[/it] inserted text: often associated with scribal insertion symbols

[kc]...[/kc] KAI compendium

[sc]...[/sc] scribal contraction, as listed in Gardthausen

[ns]...[/ns] nomen sacrum contraction and superscript line

[fn]...[/fn] final nu superscript line

[di]...[/di] diaeresis

[rb]...[/rb] rough breathing

[sb]...[/sb] smooth breathing

[c0]...[/c0] correction by original scribe

[c1]...[/c1] correction by first corrector

[c2]...[/c2] correction by second corrector

 [cx]...[/cx] correction by unidentified corrector

[d0]...[/d0] deletion by original scribe

[d1]...[/d1] deletion by first corrector

[d2]...[/d2] deletion by second corrector

 [dx]...[/dx] deletion by unidentified corrector

Fonte: (FINNEY, 2005)

 

 

Além dessas marcações existem ainda as marcações referentes às divisões do texto, ou seja, dos capítulos e versículos que existem para uma mais fácil localização das partes do texto, mas que não fazem parte dos textos originais.

Essas marcações devem ser avaliadas e deve ser concluída uma forma de retirá-las do texto uma vez que não fazem parte do texto não podem ser submetidas ao alinhamento de seqüências. Esse processo de filtragem tornou-se necessário também na tese de Timothy John Finney, desta forma nesse trabalho serão aproveitados esses algoritmos que por sua vez estão elaborados na mesma linguagem de programação utilizada nesse trabalho.

5.2.1. A Seleção dos Textos

O algoritmo de Saul B. Needleman e Christian D. Wunsch está baseado na montagem de uma matriz que tem o numero de colunas fixado pela extensão de uma das seqüências a serem alinhadas, e o número de linhas é fixado pela extensão da segunda seqüência a ser alinhada, desta forma se for tomado como exemplo uma transcrição que possui  64.000 letras e uma segunda transcrição que possui  também 64.000 letras obtém-se uma matriz de 64.000 X 64.000, esta matriz não é algo simples de ser armazenado numa estação de trabalho, devido às suas dimensões vai consumir uma considerável quantidade de memória que não é comum nas estações de trabalho.

Para resolver esse problema e para comprovar a aplicabilidade dos algoritmos de alinhamento de seqüências, utilizados no alinhamento de seqüências de DNA, nas transcrições gregas do Novo Testamento, será tomada uma parte apenas do texto parte que seja suficiente para a comprovação dessa hipótese o tamanho desses textos podem ser definidos a partir da quantidade de memória dos sistemas computacionais e do suporte de determinados sistemas operacionais a alocação de memória virtual em disco.

5.2.2. A Filtragem dos Textos

O processo de filtragem está apoiado no esquema de marcações mencionado acima, além do esquema de divisão de capítulos e versículos não foi mencionado que não será filtrado para facilitar a navegação nos textos e consiste basicamente em três etapas:

1-Substituir as marcações que podem ser substituídas.

2-Descartar as marcações que não podem ser substituídas devido ao seu caráter duvidoso.

3-Reescrever os arquivos filtrados em um novo diretório.

 

 

 

5.3. A alteração e aplicação dO Algoritmo dE alinhamento global em perl

O algoritmo de Saul B. Needleman e Christian D. Wunsch possui características voltadas à sua aplicação em seqüências de DNA, as transcrições gregas do livro de Hebreus do Novo Testamento, às quais se pretende aplicar o algoritmo possuem características que se distinguem das seqüências de DNA, isso traz a necessidade de alterações não essenciais no algoritmo para que sua aplicação seja possível nesses casos.

 

5.3.1. Ponto de partida

Como ponto de partida procedeu se uma serie de análises seqüenciais dos resultados de pequenos alinhamentos de frases para possibilitar a verificação de quais possíveis alterações deveriam ser executadas para tornar o algoritmo viável no alinhamento de seqüências de transcrições gregas do Novo Testamento.

Inicialmente o algoritmo foi utilizado exatamente como é, de forma que fossem visíveis as alterações que necessariamente deveriam ser feitas.

Essa utilização inicial foi importante para constatação de que o algoritmo apresenta aspectos interessantes para a utilização no alinhamento de seqüências de textos, mas originalmente não se apresenta adequado para a tal aplicação necessitando dessa forma de alterações que podem ser chamadas de “não essenciais” por conservarem a essência do algoritmo de programação dinâmica.

 

5.3.2. Remoção das tags

Em uma execução preliminar ficou claro que as seqüências a serem utilizadas deveriam ser tratadas a fim de remover as tags explicativas, que não são interessantes na execução do alinhamento. Então foram utilizados os algoritmos de Finney que retiram as tags que não fazem parte dos textos. Esse processo não será abordado aprofundadamente nesse trabalho por ser externo ao escopo do trabalho, mas deve ser mencionado para se ter a compreensão que os textos usados no trabalho possuem diversas características a serem resolvidas. Possivelmente a resolução destas questões não é a mais adequada o que pode ser a origem das diversas repetições de palavras encontradas nos textos utilizados.

 

5.3.3. A Escolha da fonte

Os textos selecionados são os unciais U6 e U20 por serem os que aparentemente estão mais completos. Inicialmente serão utilizados textos mais completos, contudo numa analise profunda é obvio supor que qualquer trabalho deve levar em consideração todos os textos conhecidos de forma a avaliar-se todas as opções disponíveis para a critica textual, contudo é também fácil de supor que tal trabalho exaustivo exigiria diversos outros tratamentos com algoritmos e estudos aprofundados nas línguas originais e profundo conhecimento na critica textual o que não é o escopo deste trabalho.

Para este trabalho não serão necessários testes longos então alguns capítulos do Livro de Hebreus já bastam, desde que se consiga obter dados que comprovem a viabilização do uso do algoritmo para  a análise de similaridade de seqüências.

 

5.3.4. Abertura de Arquivo

O algoritmo de Saul B. Needleman e Christian D. Wunsch necessita que se digite as seqüências a serem alinhadas na linha de comando, como essa execução é inviável para a aplicação a que se destina esse trabalho surge necessidade de adição de uma rotina de abertura de arquivos para que esse processo possa ser efetuado automaticamente a partir de arquivos contendo os textos a serem alinhados:

my $arquivo = 'teste.txt';       # nome do arquivo

open(INFO, $arquivo);           # abre o arquivo

my $seq1 = <INFO>;               # coloca ele em uma matriz

close(INFO);                    # fecha o arquivo

Então, a rotina de abertura de arquivos e preenchimento do vetor é duplicada para que seja executada com as duas seqüências a serem alinhadas, dessa forma o processo de preenchimento dos vetores de seqüências se torna tão transparente como a rotina de preencimento da matriz de alinhamento dinâmico tratada no quarto capitulo deste trabalho, facilitando a tarefa já repetitiva de que venha a fazer uso do mesmo.

 

5.3.5. Falta de Memória

O primeiro grande problema é típico do algoritmo de alinhamento dinâmico. Como o tamanho dos arquivos escolhidos é de 40.000 e 39.000 caracteres, respectivamente se torna necessária muita memória no preenchimento da matriz, para que a execução do alinhamento dos arquivos seja possível.

Numa testagem preliminar com uma estação de trabalho doméstica o montante máximo de memória disponibilizada pelo sistema operacional para a execução do algoritmo chegou à 2 GB e não foi suficiente para completar a execução do alinhamento.

A menos que se tenha então um equipamento computacional muito poderoso não é possível alinhar os textos inteiros de uma só vez.

Para solucionar este problema o texto foi então dividido em versículos viabilizando a execução do alinhamento versículo à versículo.

 Além do problema de memória, a visualização dos resultados fica comprometida quando usados textos muito longos, com a alteração na execução, também a visibilidade torna-se fácil.

 

5.3.6. Alinhamento Reverso

Na seqüência do desenvolvimento do algoritmo, percebeu se que como a alinhamento é montado com as seqüências de trás pra frente (isto é típico do algoritmo de programação dinâmica), ocorre um alinhamento forçado das ultimas palavras mesmo que sejam diferentes, alinhando espaços com letras, típica também do algoritmo, uma vez que em seqüências de DNA não há palavras, ou seja, agora há um elemento novo a ser considerado o espaço entre as palavras.

O novo elemento traz uma nova regra consigo: Não deve ser permitido “à priori” o alinhamento de letras com espaços. Esse fator é implementado através da adição de mais dois critérios à tabela de pontuação do algoritmo:

my $MISMATCH_ESPACO = -50; # -50 para espacos com letras

my $MATCH_ESPACO = 50;   #  50 para espacos que fecham

Dessa forma o algoritmo determina uma pontuação elevada para o alinhamento de espaços e uma penalização igualmente elevada para o alinhamento de espaços com letras ou vice versa.  

Após a implementação da regra para evitar o alinhamento de caracteres com espaços e valorizar o alinhamento de espaços com espaços foram executados alguns testes de forma que fosse possível verificar que a implementação da regra é eficiente:

A primeira testagem foi executada sem valores na pontuação na frase e penalização pelos espaços na frase “teto de vidro é fácil de ser quebrado”:

my $MISMATCH_ESPACO = 0; # 0 para espacos com letras

my $MATCH_ESPACO = 0;   # 0 para espacos que fecham

te---d-o de v-dro é fácil de s-er q-uebrado

telhado de vidr-o é fáci-l de se-r quebrado

O resultado demonstrou que há necessidade de se fazer valorização dos alinhamentos de espaços pos desta forma o algoritmo se comportou inadequadamente.

Em seguida atribuiu se um valor maior à pontuação pelo alinhamento de espaços isto é:

my $MISMATCH_ESPACO = 0; # 0 para espacos com letras

my $MATCH_ESPACO = 1;   # 1 para espacos que fecham

E se obteve o seguinte resultado:

te---do de v-dro é fácil de ser quebrado

telhado de vidro é fácil de ser quebrado

Esse resultado demonstrou que por menor que seja a pontuação aos alinhamentos de espaços ela já intensifica a regra de não alinhar espaços com  caracteres adiante verificou se que basta ter um valor maior para a valorização de espaços.

A pontuação dos alinhamentos entre espaços e letras acima dos alinhamentos de espaços com espaços fez com que o algoritmo se comportasse  da mesma forma que quando os valores das pontuações fossem iguais.

 

  5.3.7. Alinhamento de Palavras Distintas

O alinhamento de palavras essencialmente diferentes não é problema quando se trata de uma seqüência sem espaços como as de DNA às quais o algoritmo originalmente se destina. Na execução do alinhanento o algoritmo lê as seqüências de trás pra frente  o que faz com que as palavras sejam alinhadas nessa ordem alinhando palavras diferentes pela sua posição. Esse diferencial deve ser tratado cuidadosamente, pois o alinhamento de palavras, mesmo que sejam de escrita semelhante, como, por exemplo, as portuguesas “encaixar” e “caixa” não é mais adequado. Contudo, a freqüente presença de lacunas pode levar a conclusão de que posicionalmente “caixa” e “encaixar” devem ser alinhadas pelo algoritmo.

A solução para essa situação exigiu uma estratégia relativamente mais complexa que as utilizadas até então, que seria a utilização de um caractere de controle ao final de cada palavra, contudo esse caractere de controle não pode ser alinhado com as demais letras das seqüências e, ao mesmo tempo deve, ter relação com a palavra à que pertence para que palavras iguais venham a ter caracteres de controle iguais.

As especificações dos caracteres de controle mencionadas conduzem à conclusão de que não podem ser utilizados números em virtude da divisão de capítulos e versículos ser preservada nos textos e ser composta de números basicamente, e também, obviamente não podem ser utilizadas letras devido à composição das seqüências ser essencialmente letras. Desta forma conclui-se que devem ser usados os caracteres ASC da faixa 170 à 240 abaixo:

170 =¬          171 =½          172 =¼          173 =¡          174 =«

175 =»          176 =░          177 =▒          178 =▓          179 =│

180 =┤          181 =Á          182 =          183 =À          184 =©

185 =╣          186 =║          187 =╗          188 =╝          189 =¢

190 =¥          191 =┐          192 =└          193 =┴          194 =┬

195 =├          196 =─          197 =┼          198 =ã          199 =Ã

200 =╚          201 =╔          202 =╩          203 =╦          204 =╠

205 =═          206 =╬          207 =¤          208 =ð          209 =Ð

210 =Ê          211 =Ë          212 =È          213 =ı          214 =Í

215 =Π         216 =Ï          217 =┘          218 =┌          219 =█

220 =▄          221 =¦          222 =Ì          223 =▀          224 =Ó

225 =ß          226 =Ô          227 =Ò          228 =õ          229 =Õ

230 =µ          231 =þ          232 =Þ          233 =Ú          234 =Û

235 =Ù          236 =ý          237 =Ý          238 =¯          239 =´

240 =­

Os caracteres de controle propostos são realmente exclusivos ao texto das seqüências formando conseqüentemente um elo forte entre as palavras iguais de duas seqüências permitindo um alinhamento forçado entre elas, essa estratégia contribuiu fortemente na comprovação da viabilidade desse algoritmo para o fim apresentado neste trabalho.

A montagem dos mesmos deve ser feita, como já mencionado acima, de forma que aja uma relação entre a palavra e seu respectivo caractere de controle, fator que se obtém tomando o resto da divisão das somas da ordem ASC de cada caractere das palavras das seqüências por 70 (setenta), o que vai gerar sempre números entre 0 (zero)  e 70 (setenta), e adicionando a esse valor 170 obtém se a faixa mencionada, que por sua vez, será convertida em caracter e adicionada ao final da palavra da seqüência,  ou seja:

- A obtenção do valor por letra:

ord(letra)+ ord(letra)+ ord(letra)

-A obtenção do caractere de controle através valor das somas em seguida o caractere de controle é adicionado ao final de cada palavra ou seja concatenado às palavras.

$texto =$texto.chr(mod($som,70)+170)

 

5.3.8. Pré-processamento

A inserção do caractere de controle exige um processo que antecipa o processo de alinhamento de seqüências, um pré-processamento de forma que os caracteres de controle façam parte das seqüências no momento da execução do processo de alinhamento, assim sempre que existir um caractere de controle ao final de palavras iguais entre as duas seqüências será forçado, o alinhamento entre as mesmas. Dessa forma em uma seqüência de palavras similares na escrita não ocorrerá alinhamento de palavras diferentes se houver uma que seja idêntica .

O caractere de controle intensifica a regra de não alinhamento de espaços e letras fazendo com que palavras iguais não sejam “partidas” para serem alinhadas com palavras diferentes.

Neste ponto é importante ressaltar que o algoritmo de alinhamento dinâmico ainda reside por trás dessas novas regras sendo que na ocorrência de lacunas ele pode constatar que o alinhamento deve ser feito e que na verdade uma das palavras está danificada, mas possivelmente é a palavra equivalente da seqüência.

Por exemplo as frases:

“telhado de vidro é fácil de ser quebrado”

e

“tedo de vdro é fácil de ser quebrado”

Visivelmente devem ser alinhadas da seguinte forma:

te---do de v-dro   fácil de ser quebrado

telhado de vidro   fácil de ser quebrado

Numa análise posterior constatou-se que possivelmente os caracteres de controle se sobrepuseram à regra de alinhamento de espaços com letras e vice-versa, de forma que a pontuação ou penalização dadas não mais afetaram a execução do alinhamento dos espaços.

 

  5.3.8. Retirada dos Caracteres de Controle

Na seqüência o algoritmo deve ter uma amostragem do resultado do alinhamento de forma que seja fácil visualizar se ocorreu sucesso ou não no alinhamento das seqüências analisadas, então nesse ponto ocorre um pós-processamento que retira das seqüências todos os caracteres contidos na faixa ASC entre 170 e 240 o que pode ser simplificado genericamente “igual ou maior que 170”, visto que mesmo que os caracteres entre 240 e 255 estejam inclusos na faixa nunca estarão entre caracteres contidos nas seqüências dos textos.

 

  5.3.9. Amostragem do Resultado

Após o pós-processamento, a amostragem pode ser feita e o texto está pronto para ser utilizado como pode se verificar no anexo.

 Essas foram as alterações que se fizeram necessárias ao algoritmo para que ele se tornasse viável no alinhamento de seqüências proposto neste trabalho, contudo como posteriormente se pode verificar, existem outras alterações ou incrementos que podem ser aplicados ao algoritmo, sendo que ele sempre preserva sua essência original, a parte da programação dinâmica. O que conduz a reflexão que um algoritmo somente é bom até que surja um algoritmo melhor que o sobreponha

 

  5.3.10. Exemplo de Amostragem do Resultado

A exibição do resultado com o caractere de controle inicialmente mostrou se interessantes para o objetivo de verificar o funcionamento do algoritmo.Isso se demonstra da seguinte forma, ressaltando em vermelho os caracteres de controle e em verde diferença entre a primeira e a segunda seqüência:

<ch1><v1>ËPOLUMERWSKAI¡POLUTROPWSÎPALAIOQSLALHSASTOISÐPATRASINEN---------------TOISÐPROFHTAISõ

<ch1><v1>ËPOLUMERWSKAI¡POLUTROPWSÎPALAIOQSLALHSASTOISÐPATRASINENTOISÐPROFHTAISõTOISÐPROFHTAISõ

 

 

Em seguida os caracteres de controle são retirados apresentando o seguinte resultado

<ch 1><v 1> POLUMERWS KAI POLUTROPWS PALAI O QS LALHSAS TOIS PATRASIN EN ---------------TOIS PROFHTAIS

<ch 1><v 1> POLUMERWS KAI POLUTROPWS PALAI O QS LALHSAS TOIS PATRASIN EN TOIS PROFHTAIS TOIS PROFHTAIS

                               

5.4. A testagem dO Algoritmo

 

Uma vez demonstrado o processo de alinhamento executado a partir do algoritmo com as alterações procede-se a testagem, que visa comprovar a possibilidade de utilização deste para o fim descrito neste trabalho. 

Foram selecionadas oito situações para que se pudesse demonstrar claramente o funcionamento do algoritmo.

 

  5.4.1. Hebreus 1:1

O texto português do primeiro verso a ser avaliado é:

“Havendo Deus antigamente falado muitas vezes, e de muitas maneiras, aos pais, pelos profetas”.

O verso inicial do livro de Hebreus será tomado como ponto inicial da testagem do algoritmo. Os versos dessa referencia do manuscrito U6 e do manuscrito U20 não tem muitas ocorrências de falhas ou lacunas.

Entretanto há uma diferença que será mencionada. No final do verso do manuscrito U20 ocorre a ditografia: “TOIS PROFHTAIS” que quer dizer “pelos profetas” (TAYLOR, 1996). Essa repetição foi detectada pelo algoritmo e sinalizada. Possivelmente se trata de uma ditografia de algum amanuense, pois a repetição não altera o sentido da frase.

O resultado trazido pelo algoritmo está transcrito abaixo sendo os textos respectivamente U6 e U2.

<ch 1><v 1> POLUMERWS KAI POLUTROPWS PALAI O QS LALHSAS TOIS PATRASIN EN ---------------TOIS PROFHTAIS

<ch 1><v 1> POLUMERWS KAI POLUTROPWS PALAI O QS LALHSAS TOIS PATRASIN EN TOIS PROFHTAIS TOIS PROFHTAIS

 

 

  5.4.2. Hebreus 1:7

O texto português do verso a ser avaliado é:

“Ora, quanto aos anjos, diz: Quem de seus anjos faz ventos, e de seus ministros labaredas de fogo”.

Esse texto já apresenta mais diferenças, algumas podem ser claramente identificadas como lacunas dos manuscritos e outras aparentam ser distinções dos textos. A primeira diferença identificada pelo algoritmo é a presença de “AUTOU” no manuscrito U6 enquanto no manuscrito U20 pode ser uma lacuna ou uma diferença A segunda diferença identificada pelo algoritmo é uma lacuna do manuscrito U6 que traz apenas “PNA” enquanto que o manuscrito U20 traz “PNEUMATA”. Se trata de uma clara lacuna devido à “PNA” não ter significado algum enquanto que “PNEUMATA” pode ser traduzido do grego como vento (TAYLOR, 1996). Em seguida foi identificada no manuscrito U6 a presença da palavra “LITOURGOUS” que não está presente no manuscrito U20.

O resultado trazido pelo algoritmo está transcrito abaixo conforme o exemplo anterior.

<ch 1><v 7> KAI PROS MEN TOUS AGGELOUS AUTOU LEGEI O POIWN TOUS AGGELOUS AUTOU PN-----A KAI TOUS LITOURGOUS LEITOURGOUS AUTOU PUROS FLOGA

<ch 1><v 7> KAI PROS MEN TOUS AGGELOUS ------LEGEI O POIWN TOUS AGGELOUS AUTOU PNEUMATA KAI TOUS -----------LEITOURGOUS AUTOU PUROS FLOGA

 

  5.4.3. Hebreus 1:9

O texto português do verso a ser avaliado é:

               “Amaste a justiça e odiaste a iniqüidade; por isso Deus, o teu Deus, te ungiu com óleo de alegria, mais do que a teus companheiros;”

A escolha desse verso se dá em virtude de ter ocorrido uma imperfeição no algoritmo em virtude de ter diferenças mais intensas, entretanto a imperfeição nesse caso não invalida o algoritmo uma vez que foram identificadas as diferenças, cabe aos teólogos avaliar as diferenças encontradas .

A primeira ocorrência de diferença identificada pelo algoritmo foi a repetição da palavra “ANOMIAS” no manuscrito U6 enquanto no manuscrito U20 ocorre apenas a palavra “ANOMIAN”. Aqui merece atenção o fato que apesar de o manuscrito U6 trazer  “ANOMIAS ANOMIAN” o algoritmo identificou que a palavra idêntica no segundo manuscrito é “ANOMIAN” e alinhou esta.

Em seguida o manuscrito U6 contém três repetições “ECRISEN ECREISEN ECRISEN” que foram corretamente identificadas e alinhadas.

A próxima ocorrência é o ponto critico do algoritmo. O manuscrito U6 traz “ELEOS ELAION” enquanto que o manuscrito U20 traz apenas “ELEON” que se distingue das duas palavras do manuscrito U6. Como o algoritmo não conseguiu encontrar palavras idênticas em U6 então ele “espalhou” a ocorrência de U20 nas ocorrências de U6, realizando o alinhamento encontrado na amostra da execução do algoritmo, contudo o mais correto teria sido alinhar as palavras mais semelhantes que seriam “ELEOS” e “ELEON”. Logo pode-se argumentar que, se nessa situação, houvesse uma palavra só em U6 teria sido mais correto o alinhamento. Entretanto na ocorrência de três palavras distintas isso não ocorreu. Então cabe à critica textual decidir qual das duas palavras permanece no texto.

<ch 1><v 9> HGAPHSAS DIKAIOSUNHN KAI EMISHSAS ANOMIAS ANOMIAN DIA TOUTO ECRISEN ECREISEN ECRISEN SE O QS O QS SOU ELEOS ELAION AGALLIASEWS PARA TOUS METOCOUS SOU

<ch 1><v 9> HGAPHSAS DIKAIOSUNHN KAI EMISHSAS --------ANOMIAN DIA TOUTO ------------------ECRISEN SE O QS O QS SOU EL----E---ON AGALLIASEWS PARA TOUS METOCOUS SOU

 

  5.4.4. Hebreus 1:10

O texto português do verso a ser avaliado é:

               “e: Tu, Senhor, no princípio fundaste a terra, e os céus são obras de tuas mãos;”

 

O alinhamento realizado pelo algoritmo nesse texto está correto e o texto não apresenta grandes diferenças apenas uma lacuna no manuscrito U20 que ao invés de trazer a palavra completa “OURANOI” como no algoritmo, U6 traz apenas “OUNOI” visto que a palavra “OURANOI” em questão traduzida do grego é “céu” (TAYLOR, 1996), e “OUNOI” não tem sentido.

<ch 1><v 10> KAI SU KAT ARCAS KE THN GHN EQEMELIWSAS KAI ERGA TWN CEIRWN SOU EISIN OI OURANOI

<ch 1><v 10> KAI SU KAT ARCAS KE THN GHN EQEMELIWSAS KAI ERGA TWN CEIRWN SOU EISIN OI OU--NOI

 

  5.4.5. Hebreus 1:10

O texto português do verso a ser avaliado é:

“e qual um manto os enrolarás, e como roupa se mudarão; mas tu és o mesmo, e os teus anos não acabarão”.

O alinhamento realizado pelo algoritmo nesse texto está correto, sendo que o texto apresenta diversas diferenças, que são basicamente repetições no manuscrito U6.

O tratamento superficial da retiradas das tags pode ser a origem de tantas repetições, provavelmente haveria de ser feita uma análise mais cuidadosa dos critérios a serem tomados na execução do algoritmo de filtragem, contudo esse não é o escopo do trabalho como já foi esclarecido anteriormente.

<ch 1><v 12> KAI WSEI PERIBOLAION ALLAXIS ALLAXEIS ELIXEIS AUTOUS KAI WS EIMATION ALLAGHSONTAI SU DE O AUTOS EI KAI TA ETH SOU OUK EKLIYOUSIN EKLEIYOUSIN

<ch 1><v 12> KAI WSEI PERIBOLAION -----------------ELIXEIS AUTOUS KAI -------------ALLAGHSONTAI SU DE O AUTOS EI KAI TA ETH SOU OUK -----------EKLEIYOUSIN-

 

  5.4.6. Hebreus 1:14

O texto português do verso a ser avaliado é:

“Não são todos eles espíritos ministradores, enviados para servir a favor dos que hão de herdar a salvação?”.

Esse texto foi escolhido por apresentar muitas diferenças e lacunas o que fez com que a execução do algoritmo evidenciasse essas caracteristicas de uma forma que poderia ser diferente.

A ocorrência de repetições seguida de uma diferença ou lacuna seguidas de outra diferença ou lacuna evidenciaram a mesma ocorrência do verso 9 ou seja onde o texto eram menor e diferente ele foi “espalhado” dentro do texto do manuscrito maior e diferente fazendo com que a palavra “PNEUMATA” do manuscrito U20 fosse “espalhada” no texto “LEITOURGIKA PNATA”.

Essa ocorrência evidencia novamente que é necessária uma cuidadosa avaliação dos critérios de filtragem das tags que podem retirar muitas das repetições encontradas nos manuscritos conforme a avaliação da critica textual. Em seguida ocorre em U6 mais uma repetição diferente alinhada pelo algoritmo e finalmente uma lacuna também identificada   corretamente. 

<ch 1><v 14> OUCI PANTES EISIN LEITOURGIKA LITOURGIKA LEITOURGIKA PNATA EIS DIAKONIAN APOSTELLO-MENA- DIA TOUS MELLON TAS KLHRONOMIN KLHRONOMEIN SWTHRIAN

<ch 1><v 14> OUCI PANTES EISIN LEITOURGIKA ----------PNE---U-------MATA EIS DIAKONIANN APOSTELLO MENA DIA TOUS MELLON TAS----------- KLHRONOMEIN S---RIAN

 

  5.4.7. Hebreus 2:5

O texto português do verso a ser avaliado é:

“Porque não foi aos anjos que Deus sujeitou o mundo vindouro, de que falamos”.

Esse texto foi selecionado para que ficasse claro que na ocorrência de textos iguais o alinhamento é correto. Dessa forma não há ocorrências de diferenças repetições ou lacunas.

<ch 2><v 5> OU GAR AGGELOIS VPETAXEN THN OIKOUMENHN THN MELLOUSAN PERI HS LALOUMEN

<ch 2><v 5> OU GAR AGGELOIS UPETAXEN THN OIKOUMENHN THN MELLOUSAN PERI HS LALOUMEN

 

  5.4.8. Hebreus 2:17

O texto português do verso a ser avaliado é:

“E contra quem se indignou por quarenta anos? Não foi porventura contra os que pecaram, cujos corpos caíram no deserto?”.

Esse texto traz um elemento importante a ser esclarecido. Ele apresenta uma palavra entre os manuscritos que é ao mesmo tempo diferente e apresenta uma lacuna, ou seja, apresenta duas características que devem ser detectadas. Então o manuscrito U6 apresenta “WFILEN” equanto o manuscrito U20 traz “WFEILE”, mesmo sendo diferentes e contendo as lacunas, foram alinhadas corretamente. Na seqüência  ainda ocorrem repetições com palavras diferentes no manuscrito U6 e  finalmente um alinhamento de outra palavra que apesar de  ter uma letra diferente entre os manuscritos, foi  detectada e alinhada corretyamente.

<ch 2><v 17> OQEN WF-ILEN KATA PANTA TOIS ADELFOIS OMOIWQHNAI JNA ELEHMWN GENHTE GENHTAI KAI PISTOS ARCIEREUS TA PROS TON QN EIS TO EILASKESQAI ILASKESQAI TAS AMARTIAS TOU LA OU

<ch 2><v 17> OQEN WFEILE- KATA PANTA TOIS ADELFOIS OMOIWQHNAI  JNA ELEHMWN -------GENHTAI KAI PISTOS ARCIEREUS TA PROS TON QN EIS TO ------------JLASKESQAI TAS AMARTIAS TOU LA OU

 

 

 

5.5. resultados da testagem

O algoritmo desenvolvido e testado na amostragem acima se mostrou viável para uma avaliação de similaridade de seqüências de transcrições gregas.

A seqüência de versos testados demonstrou claramente a viabilidade, mesmo nas diversas situações adversas encontradas, a presença de lacunas repetições, mais comuns nos textos foram, identificadas e reveladas na amostragem.

Originalmente o algoritmo possui um esquema de pontuação a ser atribuída às seqüências alinhadas. Na  aplicação deste trabalho essa pontuação não é mais utilizada devido a, no momento da execução do alinhamento, o algoritmo computar os caracteres de controle alterando a pontuação.

Em um segundo momento, deveria ser introduzida uma rotina que corrigisse essa situação de forma que seja possível se ter a pontuação do alinhamento, assim seria possibilitada a analise estatística.

As situações incorretas verificadas são passiveis de tratamento, os exemplos comprovam satisfatoriamente a viabilidade do uso do algoritmo de   Needleman e Wunsch (Needleman, S. and Wunsch, C. 1970), para o alinhamento de seqüências das transcrições gregas Neo-Testamentárias, e possivelmente para qualquer tipo de seqüência de caracteres. O algoritmo de programação dinâmica permanece como parte essencial no algoritmo desenvolvido.

A viabilidade em textos com muitas lacunas e falhas não foi verificada

A testagem total efetuada encontra se no anexo III deste trabalho. Demonstra o comportamento do algoritmo em 40 versos dos manuscritos escolhidos. A partir disto poder-se-ia futuramente aplicá-lo ao alinhamento múltiplo utilizando-se então de vários textos e da pontuação corrigida do algoritmo original. Assim ter-se-ia uma nova e poderosa ferramenta para avaliar os agrupamentos dos textos bíblicos não de somente um livro, mas de toda a Bíblia e de qualquer outro livro que possuísse muitos manuscritos, desde que estes como os utilizados nesse trabalho estivessem adequadamente transcritos.

Uma contagem superficial foi feita na intenção de se ter uma noção de como o algoritmo se comportou. Os resultados estão na tabela abaixo, sendo situação 1 onde o algoritmo se comportou adequadamente em todas as verificações de alinhamento possíveis no texto e situação zero onde ocorreu um alinhamento que poderia ser diferente, ou melhor, contudo não compromete a validação devido ao seu contexto.

Uma pontuação absoluta seria letra por letra, essa pontuação originalmente é feita pelo algoritmo, contudo a contagem após as alterações apresentaria distorções referentes à inserção e alinhamento dos caracteres de controle inseridos no algoritmo. Dessa forma foi decidido por não se apresentar as pontuações do algoritmo, pois a amostragem dos textos por si já é conclusiva. Numa próxima etapa seria importante verificar as pontuações a fim de se dar continuidade ao trabalho.

 

 

 

 Tabela 6: Amostragem do Alinhamento Verso a Verso

Livro

Capitulo

Versiculo

Situação

Hebreus

1

1

1

Hebreus

1

2

1

Hebreus

1

3

1

Hebreus

1

4

1

Hebreus

1

5

1

Hebreus

1

6

1

Hebreus

1

7

1

Hebreus

1

8

1

Hebreus

1

9

0

Hebreus

1

10

1

Hebreus

1

11

1

Hebreus

1

12

1

Hebreus

1

13

1

Hebreus

1

14

0

Hebreus

2

1

1

Hebreus

2

2

0

Hebreus

2

3

1

Hebreus

2

4

1

Hebreus

2

5

1

Hebreus

2

6

1

Hebreus

2

7

1

Hebreus

2

8

1

Hebreus

2

9

1

Hebreus

2

10

1

Hebreus

2

11

1

Hebreus

2

12

1

Hebreus

2

13

1

Hebreus

2

14

0

Hebreus

2

15

1

Hebreus

2

16

1

Hebreus

2

17

1

Hebreus

2

18

0

Hebreus

3

1

1

Hebreus

3

2

1

Hebreus

3

3

0

Hebreus

3

4

1

Hebreus

3

5

1

Hebreus

3

6

1

Hebreus

3

7

1

Hebreus

3

8

1

 

 

O alinhamento múltiplo não deixa de ser importante, as técnicas mencionadas são de grande valia, oportunamente esse tema pode ser abordado como continuidade desse trabalho.

Na seqüência do alinhamento múltiplo seria possível completar o estudo montando a busca do arquétipo, bem como verificar os agrupamentos de todos os textos conhecidos.

 

Conclusão

A aplicação de algoritmos de biologia computacional, mais especificamente os algoritmos de alinhamento de seqüências é útil para a análise de qualquer tipo de seqüência. Especificamente nesse trabalho demonstrou ser viável na verificação de similaridade de transcrições gregas Neo-Testamentárias do livro de Hebreus. 

A crítica textual tem abundante bibliografia muito aprofundada, desta forma a abordagem aqui se restringe à informação essencial que forneça contexto que conduza à aplicação prática. 

Evidentemente a viabilidade foi comprovada com protótipos que aplicaram tais algoritmos, as peculiaridades das seqüências de entrada foram avaliadas de forma que os resultados não tenham distorções oriundas de uma análise medíocre, isto inclui uma penalização adequada nos casos de lacunas referentes à impossibilidade de se saber o conteúdo relacionado no manuscrito devido ao seu estado de conservação.

O alinhamento múltiplo ocupa proeminência no tipo de analise de seqüências devido às suas características que favorecem um suporte maior às grandes quantidades de entradas divergentes ou distintas que se referem ao mesmo manuscrito. A analise do alinhamento global e do algoritmo de programação dinâmica tem precedência por isso ocuparam esse lugar nesse trabalho, vindo em seguida a abordagem do alinhamento múltiplo não contemplada.

No trabalho foram abordadas as técnicas de alinhamento global  aplicadas no livro de Hebreus nas transcrições encontradas no trabalho de Finney. A linguagem de programação utilizada foi perl.

Uma implementação prática foi desenvolvida de forma que dadas entradas de transcrições se tenha de saída a amostragem dos textos alinhados de forma a se poder comprovar a viabilidade do algoritmo (anexo II).

O algoritmo de   Needleman e Wunsch (Needleman, S. and Wunsch, C. 1970) foi submetido a diversas alterações na intenção de adequá-lo ao alinhamento das seqüências de caracteres das transcrições gregas do livro de Hebreus. Ao final foi constatado que o algoritmo original é de grande valia para a análise de qualquer seqüência de caracteres, podendo ser utilizado nas comparações de textos.

 

6. Referências bibliográficas

ANGLADA, Paulo R. B. A Teoria de Westcott e Hort e o Texto Grego do Novo Testamento:Um Ensaio em Manuscritologia Bíblica. Disponível em: <http://solascriptura-tt.org/Bibliologia-PreservacaoTT/TeoriaWH-NTGrego-ManuscritologiaBiblica-Anglada.htm /> Acessado em 09 mai 2005.

APOLINÁRIO, Pedro. História do texto Bíblico. Disponível em: <http://www.profecias.com.br/historia/historiadotexto.htm> Acessado em 18 jun 2005.

MOUNT, DAVID W. Bioinformatics-Sequence and Genome Analysis,Cold Spring Harbor Laboratory Press.

CRICK, F. H.C. e WATSON, J. D.  Molecular Structure of Nucleic Acids. Nature: no. 4356 April 25, 1953.

CRITICISMO BÍBLICO. Em: O Novo Dicionário da BÍBLIA. São Paulo: SP Sociedade Religiosa Edições Vida Nova, 1995.  p.354-357.

ELLIOT, Rich. The Encyclopedia of New Testament Textual Criticism. Disponível em: < http://www.skypoint.com/~waltzmn/> Acessado em 09 mai 2005.

FELSENSTEIN J. Phylip. (Phylogeny Interface Package) 6.5 version 3.6. Department of Genetics, University of Washington, Seattle.

FINNEY, Timothy J. The Ancient Witnesses of the Epistle to the Hebrews: A Computer-Assisted Analysis of the Papyrus and Uncial Manuscripts of pros ebraious. Ph.D. diss., Murdoch University, 1999. Disponível em: <http://purl.org/tfinney/thesis> Acessado em 03 abr 2005.

GEIGER, Dan. Introduction to Algorithms in Computational Biology: Lecture 1. Disponível em: <http://www.cs.technion.ac.il/~dang/courseCB/lecture01.pdf> Acessado em 03 abr 2005.

GUNDRY, Robert H. Panorama do Novo Testamento. São Paulo: SP Sociedade Religiosa Edições Vida Nova, 1989.

GUPTA S. K., KECECIOGLU J.D., AND SCHAFFER A.A. 1995.Improving the pratical space and time efficiency of the shortest-paths approach to sum-of-pairs multiple sequence alignment. J. Comput.Biol.2: 459-472.

GUSFELD, Dan. Algorithms on Strings, Trees and Sequences. Cambridge: Cambridge University Press, 1997.

KRUSKAL, J.B. and SANKOFF, D. 1983. An anthology of algorithms and concepts for sequence comparison. In Sankoff, D. (ed.) Time warps, string edits, and macromolecules: the theory and practice of sequence comparison. Addison-Wesley, Reading, Mass, pp.265-310.

METZGER, B. M. The Text of the New Testament: Its Transmission, Corruption and Restoration. 2ª Edição.Nova Iorque: Oxford, 1969.

MOREIRA, Ildeu de Castro. 50 Anos da Dupla Hélice e as Contribuições da Física. Disponível em:<http://www.bibvirt.futuro.usp.br/textos/hemeroteca/fie/fie04n1/fie04n1_03.pdf>acessado em 23 mai 2005.

NEEDLEMAN, S. E WUNSH, C. 1970. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol. Biol., 48:443-453.

SETUBAL, J. MEIDANIS J. Introduction to Computational Molecular Biology. Boston: PWS, 1997.

SHAMIR, Ron. Algorithms in Molecular Biology: Lecture 2. Disponível em: <http://www.math.tau.ac.il/~rshamir/algmb/01/scribe02/lec02.pdf> Acessado em 03 abr 2005.

SMITH, T.F. E WATERMAN, M.S. 1981. Comparison of bio-sequences. Adv. Appl. Math., 2:482-489.

TAYLOR, W. C. Dicionário do Novo Testamento Grego. Rio de Janeiro: JUERP, 1991.

TAYLOR, W. C. Introdução ao estudo do Novo Testamento Grego. São Paulo: Editora Batista Regular, 1999.

TERRA.  Cientistas anunciam mapeamento do genoma humano. Disponível em: <http://www.terra.com.br/mundo/2000/06/26/015.htm >  Acessado em 18 jun 20005.

TEXTO E VERSÕES. In: O Novo Dicionário da BÍBLIA. São Paulo: SP Sociedade Religiosa Edições Vida Nova, 1995.  p.354-357.

SANKOFF D. 1972. Matching sequences under deletion/insertion constraint. Proc Natl Acad Sci SA, 69:4–6

SANKOFF D, CEDERGREN R. 1973. A test for nucleotide sequence homology.J Mol Biol, 77:159–64.

THORPE, J. C. Multivariate Statistical Analysis for Manuscript Classification. Disponível em: < http://rosetta.reltech.org/TC/vol07/Thorpe2002.html> Acessado em 01 jun 2005.

TOMPA, Martim. Lecture Notes on Biological Sequence Analysis. Disponível em: <http://www.cs.washington.edu/education/courses/527/00wi/lectures/roottr.pdf> Acessado em 03 abr 2005.

WILLKER, Wieland. Principal Component Analysis of Manuscripts of the Gospel of John. Disponível em: <http://www-user.uni-bremen.de/~wie/pub/Analysis-PCA.html> Acessado em 03 abr 2005.

YORAV, Avishai. "GO TO THE ANT…" Phylogenetic Algorithm As an Aid in Forming a Manuscript Tradition Stemmata (feasibility study). Disponível em: <http://www.yorav.co.il/Avishay/Avishay-pirsumim/Phylogenetic%20Algorithm.htm> Acessado em 19 jun 2005.

Anexos

ANEXO I – Algoritmo Original

 

 

# Needleman-Wunsch  Algorithm

 

# usage statement

die "usage: $0 <sequence 1> <sequence 2>\n" unless @ARGV == 2;

 

# get sequences from command line

my ($seq1, $seq2) = @ARGV;

 

# scoring scheme

my $MATCH    =  1; # +1 for letters that match

my $MISMATCH = -1; # -1 for letters that mismatch

my $GAP      = -1; # -1 for any gap

 

# initialization

my @matrix;

$matrix[0][0]{score}   = 0;

$matrix[0][0]{pointer} = "none";

for(my $j = 1; $j <= length($seq1); $j++) {

    $matrix[0][$j]{score}   = $GAP * $j;

    $matrix[0][$j]{pointer} = "left";

}

for (my $i = 1; $i <= length($seq2); $i++) {

    $matrix[$i][0]{score}   = $GAP * $i;

    $matrix[$i][0]{pointer} = "up";

}

 

# fill

for(my $i = 1; $i <= length($seq2); $i++) {

    for(my $j = 1; $j <= length($seq1); $j++) {

        my ($diagonal_score, $left_score, $up_score);

 

        # calculate match score

        my $letter1 = substr($seq1, $j-1, 1);

        my $letter2 = substr($seq2, $i-1, 1);                           

        if ($letter1 eq $letter2) {

            $diagonal_score = $matrix[$i-1][$j-1]{score} + $MATCH;

        }

        else {

            $diagonal_score = $matrix[$i-1][$j-1]{score} + $MISMATCH;

        }

 

        # calculate gap scores

        $up_score   = $matrix[$i-1][$j]{score} + $GAP;

        $left_score = $matrix[$i][$j-1]{score} + $GAP;

 

        # choose best score

        if ($diagonal_score >= $up_score) {

            if ($diagonal_score >= $left_score) {

                $matrix[$i][$j]{score}   = $diagonal_score;

                $matrix[$i][$j]{pointer} = "diagonal";

            }

        else {

                $matrix[$i][$j]{score}   = $left_score;

                $matrix[$i][$j]{pointer} = "left";

            }

        } else {

            if ($up_score >= $left_score) {

                $matrix[$i][$j]{score}   = $up_score;

                $matrix[$i][$j]{pointer} = "up";

            }

            else {

                $matrix[$i][$j]{score}   = $left_score;

                $matrix[$i][$j]{pointer} = "left";

            }

        }

    }

}

 

# trace-back

 

my $align1 = "";

my $align2 = "";

 

# start at last cell of matrix

my $j = length($seq1);

my $i = length($seq2);

 

while (1) {

    last if $matrix[$i][$j]{pointer} eq "none"; # ends at first cell of matrix

 

    if ($matrix[$i][$j]{pointer} eq "diagonal") {

        $align1 .= substr($seq1, $j-1, 1);

        $align2 .= substr($seq2, $i-1, 1);

        $i--;

        $j--;

    }

    elsif ($matrix[$i][$j]{pointer} eq "left") {

        $align1 .= substr($seq1, $j-1, 1);

        $align2 .= "-";

        $j--;

    }

    elsif ($matrix[$i][$j]{pointer} eq "up") {

        $align1 .= "-";

        $align2 .= substr($seq2, $i-1, 1);

        $i--;

    }   

}

 

$align1 = reverse $align1;

$align2 = reverse $align2;

print "$align1\n";

print "$align2\n";

 

 

 

ANEXO II – Algoritmo Alterado

 

 

# Needleman-Wunsch  Algorithm

#FUNÇÕES

###################################################################################

#FUNÇÃO MOD

sub mod {

    my ($mod, $div) = @_;

        return($mod - $div * ( int( $mod / $div)));

}

# obtendo as sequencias de arquivos

####################################################################################

# busca da sequencia 1 no arquivo

my $arquivo = 'a';                    # nome do arquivo

open(INFO, $arquivo);           # abre o arquivo

my $seq1 = <INFO>;              # coloca ele em uma matriz

close(INFO);                    # fecha o arquivo

 

 

 

#####################################################################################

#INSERINDO O NUMERO DE CHECAGEMNA SEQUENCIA 1 E RETIRANDO CARATERE DE QUEBRA DE LINHA E OUTROS CARACTERES

my $texts = '';

my $TLENF = length $text;

$som=0;

my $TLENF = length $seq1;

for (my $t=0; $t <= $TLENF ; ++$t) {

        #RETIRANDO CARACTERES INVALIDOS NA EXECUÇÃO DO ALINHAMENTO DE SEQUENCIAS

        # QUEBRA DE LINHA

        # SINAL DE IGUAL

        #CARACTERE ' ³ '

        if ( (ord(substr($seq1, $t, 1)) eq 13) || ord(substr($seq1, $t, 1)) eq  61 || ord(substr($seq1, $t, 1)) eq  179 || ord(substr($seq1, $t, 1)) eq  144  || ord(substr($seq1, $t, 1)) eq  163 ){

               if(ord(substr($seq1, $t, 1)) eq 13){

                               $texts =$texts. " ";

                       }

                 }

               else

               {

               if(substr($seq1, $t, 1)  eq  " ")

                       {

                               $texts =$texts.chr(mod($som,70)+170);

                               $som = 0;

                       }

               else

               {

                       $texts =$texts. substr($seq1, $t, 1);

                       $som = $som + ord(substr($seq1, $t, 1));

                      

               }

        }

  }

 

$seq1= $texts;

##############################################################################

#BUSCANDO DADOS DA SEQUENCIA 2

my $arquivo = 'b';       # nome do arquivo

open(INFO, $arquivo);           # abre o arquivo

my $seq2 = <INFO>;               # coloca ele em uma matriz

close(INFO);                    # fecha o arquivo

$texts='';

$som=0;

#########################################################################################

#INSERINDO O NUMERO DE CHECAGEM NA  SEQUENCIA 2 E RETIRANDO CARACTERES DE QUEBRA DE LINHA E OUTROS

$TLENF = (length $seq2)-1;

for (my $t=0; $t <= $TLENF ; ++$t) {

#RETIRANDO CARACTERES INVALIDOS NA EXECUÇÃO DO ALINHAMENTO DE SEQUENCIAS

        # QUEBRA DE LINHA

        # SINAL DE IGUAL

        #CARACTERE ' ³ '

        if ( ord(substr($seq2, $t, 1)) eq  13 || ord(substr($seq2, $t, 1)) eq  61 || ord(substr($seq2, $t, 1)) eq  179  || ord(substr($seq2, $t, 1)) eq  144 || ord(substr($seq2, $t, 1)) eq  163 ){

            if(ord(substr($seq2, $t, 1)) eq 13){

                               $texts =$texts. " ";

                       }

 

                 }

               else

               {

               if(substr($seq2, $t, 1)  eq  " ")

                       {

                               $texts =$texts.chr(mod($som,70)+170);

                               $som = 0;

                       }

               else

               {

                      

                               $texts =$texts. substr($seq2, $t, 1);

                               $som = $som + ord(substr($seq2, $t, 1));

                      

               }

        }

  }

$seq2 = $texts;

 

 

 

########################################################################################

# definindo esquema de pontuação

my $MATCH    =  1;                     # +1 para letras iguais

my $MISMATCH = -1;                            # -1 para letras diferentes

my $GAP      = -1;                            # -1 para lacunas

my $MISMATCH_ESPACO = -50;             # -50 para espacos com letras Ricardo

my $MATCH_ESPACO = 50;                        #  50 para espacos que fecham Ricardo

 

# inicialização

my @matrix;

$matrix[0][0]{score}   = 0;

$matrix[0][0]{pointer} = "none";

 

 

 

for(my $j = 1; $j <= length($seq1); $j++) {

    $matrix[0][$j]{score}   = $GAP * $j;

    $matrix[0][$j]{pointer} = "left";

}

for (my $i = 1; $i <= length($seq2); $i++) {

    $matrix[$i][0]{score}   = $GAP * $i;

    $matrix[$i][0]{pointer} = "up";

}

 

# PREENCHENDO A MATRIZ

for(my $i = 1; $i <= length($seq2); $i++) {

    for(my $j = 1; $j <= length($seq1); $j++) {

        my ($diagonal_score, $left_score, $up_score);

 

        my $letter1 = substr($seq1, $j-1, 1);

        my $letter2 = substr($seq2, $i-1, 1);

 

 

        # calculando a pontuação de "matchs"******************************************************************

 

 

        #se a letra X da primeira matriz for igual a letra x da segunda matriz

               if ($letter1 eq $letter2) {

        #se a letra X da primeira matriz for igual a espaço então a letra x da segunda matriz tb será espaço  devido ao primeiro if

                       if ( $letter1 eq " " ) {

        # a variável $diagonal_score  recebe a pontuação relativa à combinação de espaços

                               $diagonal_score = $matrix[$i-1][$j-1]{score} + $MATCH_ESPACO; #Ricardo

                                 } else {

                               $diagonal_score = $matrix[$i-1][$j-1]{score} + $MATCH;

                       }

        #se a letra X da primeira matriz for diferente a letra x da segunda matriz

                } else {

                       if ( ( $letter1 eq " " ) || ( $letter2 eq " " ) ) {

                               $diagonal_score = $matrix[$i-1][$j-1]{score} + $MISMATCH_ESPACO; #Ricardo

                       } else {

                               $diagonal_score = $matrix[$i-1][$j-1]{score} + $MISMATCH;

 

                       }

               }

        # calculando pontuação de lacunas ********************************************************************

        $up_score   = $matrix[$i-1][$j]{score} + $GAP;

        $left_score = $matrix[$i][$j-1]{score} + $GAP;

 

 

               # escolhendo melhor pontuação

        if ($diagonal_score >= $up_score) {

            if ($diagonal_score >= $left_score) {

                $matrix[$i][$j]{score}   = $diagonal_score;

                $matrix[$i][$j]{pointer} = "diagonal";

            }

        else {

                $matrix[$i][$j]{score}   = $left_score;

                $matrix[$i][$j]{pointer} = "left";

            }

        } else {

            if ($up_score >= $left_score) {

                $matrix[$i][$j]{score}   = $up_score;

                $matrix[$i][$j]{pointer} = "up";

            }

            else {

                $matrix[$i][$j]{score}   = $left_score;

                $matrix[$i][$j]{pointer} = "left";

            }

        }

    }

}

 

# trace-back

 

my $align1 = "";

my $align2 = "";

 

# iniciando da ultima celula da matriz

my $j = length($seq1);

my $i = length($seq2);

 

while (1) {

    last if $matrix[$i][$j]{pointer} eq "none"; # terminando da primeira celula da matriz

 

    if ($matrix[$i][$j]{pointer} eq "diagonal") {

        $align1 .= substr($seq1, $j-1, 1);

        $align2 .= substr($seq2, $i-1, 1);

        $i--;

        $j--;

    }

    elsif ($matrix[$i][$j]{pointer} eq "left") {

        $align1 .= substr($seq1, $j-1, 1);

        $align2 .= "-";

        $j--;

    }

    elsif ($matrix[$i][$j]{pointer} eq "up") {

        $align1 .= "-";

        $align2 .= substr($seq2, $i-1, 1);

        $i--;

    }

}

 

$align1 = reverse $align1;

$align2 = reverse $align2;

print cls;

#print" \n ***********************SEQ COM CHECAGEM ************** \n";

#print "$align1\n";

#print " \n";

#print "$align2\n";

 

#print" \n **********************SEQ  LIMPAS ************** \n";

$align11="";

$TLENF = (length $align1)-1;

for (my $t=0; $t <= $TLENF ; ++$t) {

               #print ord (substr($align1, $t, 1));

        if (ord (substr($align1, $t, 1)) >= 170 ) {

        $align11=$align11." ";

        }

        else{

               $align11=$align11.substr($align1, $t, 1);

        }

    }

$align22="";

$TLENF = (length $align2)-1;

for (my $t=0; $t <= $TLENF ; ++$t) {

              

        if (ord (substr($align2, $t, 1)) >= 170 ) {

               $align22=$align22." ";

        }

        else{

               $align22=$align22.substr($align2, $t, 1);

        }

    }

   

print" \n";

print "$align11 \n";

#print" \n \n";

print "$align22 \n";

 

 

ANEXO III– Amostragem das Execuções Efetuadas

 

<ch 1><v 1> POLUMERWS KAI POLUTROPWS PALAI O QS LALHSAS TOIS PATRASIN EN ---------------TOIS PROFHTAIS

<ch 1><v 1> POLUMERWS KAI POLUTROPWS PALAI O QS LALHSAS TOIS PATRASIN EN TOIS PROFHTAIS TOIS PROFHTAIS

<ch 1><v 2> EP' --------ESCATOU TWN HMERWN TOUTWN ELALHSEN HMIN EN VIW ON EQHKEN KLHRONOMON PANTWN DI' OU KAI EPOIHSEN TOUS AIWNAS TOUS AIWNAS EPOIHSEN EPOIHSEN TOUS AIWNAS

<ch 1><v 2> EP' ESCATOU ESCATOU TWN HMERWN TOUTWN ELALHSEN HMIN EN -UW ON EQHKEN KLHRONOMON PANTWN DI- OU KAI ---------------------TOUS AIWNAS ----------EPOIHSEN -----------

<ch 1><v 3> OS WN APAUGASMA THS DOXHS KAI CARAKTHR THS VPOSTASEWS AUTOU FERWN TE TA PANTA TW RHMATI THS DUNAMEWS AUTOU DI' AUTOU DI' EAUTOU KAQARISMON ------------TWN AMARTIWN HMWN POIHSAMENOS EKAQISEN EN DEXIA THS MEGALOSU NHS EN VYHLOIS

<ch 1><v 3> OS WN APAUGASMA THS DOXHS KAI CARAKTHR THS UPOSTASEWS AUTOU FERWN TE TA PANTA TW RHMATI THS DUNAMEWS AUTOU --------- DI- EAUTOU KAQARISMON POIHSAMENOS TWN AMARTIWN HMWN ----------- EKAQISEN EN DEXIA THS MEGALOSU NHS EN UYHLOIS

<ch 1><v 4> TOSOUTW KRITTW KREITT-W GENOMENOS TWN AGGELWN- OSW DIAFORWTERON PAR' AUTOUS KEKLHRONOMHKEN ONOMA

<ch 1><v 4> TOSOUTW -------KREITTON GENOMENOS TWN AGGELWNE OSW DIAFORWTERON PAR- AUTOUS KEKLHRONOMHKEN ONOMA

<ch 1><v 5> TINI GAR EIPEN TWN AGGELWN POTE POTE TWN AGGELWN  VIOS MOU EI SU EGW SHMERON GEGENNHKA SE  KAI PALIN EGW ESOMAI AUTW EIS PATERA KAI AUTOS ESTE ESTAI MOI EIS VION-

<ch 1><v 5> TINI GAR EIPEN -----------------POTE TWN AGGELWN ---US MOU EI SU EGW SHMERON GEGENNHKA SE -KAI PALIN EGW ESOMAI AUTW EIS P---RA KAI AUTOS -----ESTAI MOI EIS --UN

<ch 1><v 6> OTAN DE PALIN EISAGAG-H TON PRWTOTOKON EIS THN OIKOUMENHN LEGEI KAI PROSKUNHSATWSAN AUTW PANTES AGGELOI QU

<ch 1><v 6> OTAN DE PALIN EISAGAGEI TON PRWTOTOKON EIS THN OIKOUMENHN LEGEI KAI PROSKUNHSATWSAN AUTW PANTES AGGELOI QU

<ch 1><v 7> KAI PROS MEN TOUS AGGELOUS AUTOU LEGEI  O POIWN TOUS AGGELOUS AUTOU PN-----A KAI TOUS LITOURGOUS LEITOURGOUS AUTOU PUROS FLOGA

<ch 1><v 7> KAI PROS MEN TOUS AGGELOUS ------LEGEI -O POIWN TOUS AGGELOUS AUTOU PNEUMATA KAI TOUS -----------LEITOURGOUS AUTOU PUROS FLOGA

<ch 1><v 8> PROS DE TON VION O QRONOS SOU O QS EIS TON AIWNA TOU AIWNOS KAI RABDOS EUQUTHTOS H RABDOS THS BASILIAS BASILEIAS SOU

<ch 1><v 8> PROS DE TON --UN O QRONOS SOU O QS EIS TON AIWNA TOU AIWNOS ----RABDOS EUQUTHTOS H RABDOS THS ---------BASILEIAS SOU

<ch 1><v 9> HGAPHSAS DIKAIOSUNHN KAI EMISHSAS ANOMIAS ANOMIAN DIA TOUTO ECRISEN ECREISEN ECRISEN SE O QS O QS SOU ELEOS ELAION AGALLIASEWS PARA TOUS METOCOUS SOU

<ch 1><v 9> HGAPHSAS DIKAIOSUNHN KAI EMISHSAS ANOMI---AN---   DIA TOUTO -----------------ECRISEN SE O QS O QS SOU<  EL----E---ON AGALLIASEWS PARA TOUS METOCOUS SOU

<ch 1><v 10> KAI SU KAT ARCAS KE THN GHN EQEMELIWSAS KAI ERGA TWN CEIRWN SOU EISIN OI OURANOI

<ch 1><v 10> KAI SU KAT ARCAS KE THN GHN EQEMELIWSAS KAI ERGA TWN CEIRWN SOU EISIN OI OU--NOI

<ch 1><v 11> AUTOI APOLOUNTAI SU DE DIAMENIS DIAMENEIS KAI PANTES WS EIMATION MATION PALAIWQHSONTAI

<ch 1><v 11> AUTOI APOLOUNTAI SU DE ---------DIAMENEIS KAI PANTES WS --------JJMATION PALAIWQHSONTAI

<ch 1><v 12> KAI WSEI PERIBOLAION ALLAXIS ALLAXEIS ELIXEIS AUTOUS KAI WS EIMATION ALLAGHSONTAI SU DE O AUTOS EI KAI TA ETH SOU OUK EKLIYOUSIN EKLEIYOUSIN

<ch 1><v 12> KAI WSEI PERIBOLAION -----------------ELIXEIS AUTOUS KAI -------------ALLAGHSONTAI SU DE O AUTOS EI KAI TA ETH SOU OUK -----------EKLEIYOUSIN

<ch 1><v 13> PROS TINA DE TWN AGGELWN EIRHKEN POTE KAQOU EK DEXIWN MOU EWS AN QW TOUS ECQROUS SOU VPOPODION TWN PODWN SOU

<ch 1><v 13> PROS TINA DE TWN AGGELWN EIRHKEN POTE KAQOU EK DEXIWN MOU EWS AN QW TOUS ECQROUS SOU UPOPODION TWN PODWN SOU

<ch 1><v 14> OUCI PANTES EISIN LEITOURGIKA LITOURGIKA LEITOURGIKA PNATA EIS DIAKONIAN APOSTELLO-MENA- DIA TOUS MELLON-TAS KLHRONOMIN KLHRONOMEIN SWTHRIAN

<ch 1><v 14> OUCI PANTES EISIN LEITOURGIKA ----------PNE---U-------MATA EIS DIAKONIANN APOSTELLO MENA  DIA TOUS MELLON TAS----------- KLHRONOMEIN S---RIAN

<ch 2><v 1> DIA TOUTO DI DEI PERISSOTERWS -----PROSECEIN HMAS TOIS AKOUSQISIN AKOUSQQEISIN MH POTE PARARUWMEN PARARRUWMEN

<ch 2><v 1> DIA TOUTO ---DEI PERISSOTERWS HMAS PROSECEIN -----TOIS AKOUSQHSIN AKOUSQEISIN MH POTE PARARUWMEN ------------

<ch 2><v 2> EI GAR O DI AGGELWN LALHQIS LALHQEIS LOGOS EGENETO BEBAIOS KAI PASA PARABASIS KAI PARAKOH -ELAB---E--------------------N ENDIKON MISSQAPODOSIAN -

<ch 2><v 2> EI GAR O DI AGGE------L--OU LALHQEIS LOGOS EGENETO BEBAIOS KAI PASA PARABASIS KAI PARAKOH  ELABEN ENDIKON MISQAPODOSI AN ENDIKON MISQAPODOSIAN

<ch 2><v 3> PWS HM-IS------------- HMEIS EKFEUXOMEQA ------------THLIKAUTHS AMELHSANTES SWTHRIAS HTIS ARCHN LABOUSA LALEISQAI DIA TOU KU VPO TWN AKOUSANTWN EIS HMAS EBEBAIWQH

<ch 2><v 3>PWS HMEIS EKFEU XOMEQA HMEIS EKFEUXOMEQA  THLIKAUTHS THLIKAUTHS AMELHSANTES S---RIAS HTIS ARCHN LABOUSA LALEISQAI DIA TOU KU UPO TWN AKOUSANTWN EIS HMAS EBEBAIWQH

<ch 2><v 4> SUNEPIMARTUROUNTOS TOU QU SHMIOIS SHMEIOIS TE KAI TERASIN KAI POIKILAIS DUNAMESIN KAI PNS AGIOU MERISMOIS KATA THN TOU QU AUTOU QELHSIN

<ch 2><v 4> SUNEPIMARTUROUNTOS TOU QU --------SHMEIOIS TE K-- TERASI KAI POIKILAAIS DUNAMESI KAI PNS AGIOU MERISMOIS KATA THN -------AUTOU QELHSIN

<ch 2><v 5> OU GAR AGGELOIS VPETAXEN THN OIKOUMENHN THN MELLOUSAN PERI HS LALOUMEN

<ch 2><v 5> OU GAR AGGELOIS UPETAXEN THN OIKOUMENHN THN MELLOUSAN PERI HS LALOUMEN

<ch 2><v 6> DIEMARTURATO DE POU TIS LEGWN TI ESTIN ANOS OTI MIMNHSKH AUTOU HVIOS ANQRWPOU OTI EPISKEPTH AUTON

<ch 2><v 6> DIEMARTURATO DE POU TIS LEGWN  TI ESTIN ANOS  OTI MIMNHSKH AUTOU HUIOS AN----OU OTI EPISKEPTH AUTON

<ch 2><v 7> ELATTWSAS HLATTWSAS AUTON BRACU TI PAR AGGELOUS DOXH KAI TIMH ESTEFANWSAS AUTON KAI KATESTHSAS AUTON EPI TA ERGA TWN CEIRWN SOU

<ch 2><v 7> ----------HLATTWSAS AUTON BRACU TI PAR AGGELOUS DOXH KAI TIMH ESTEFANWSAS ---------------------AUTON ---------------------------

<ch 2><v 8> PANTA ------------------VPETAXAS-------- VPOKATW TWN ------PODWN AUTOU EN TW GAR TA PANTA VPOTAXAI AUTW ---------OUDEN AFHKEN AUTW ANUPOTAKTON NUN DE OUPW ORWMEN AUTW TA PANTA VPOTETAGMENA

<ch 2><v 8> PANTA UPETAXAS UPETAXAS UPETAXAS UPOKATW UPOKATW TWN PODWN PODWN AUTOU EN ---GAR ------TW UPOTAXAI AUTW TA PANTA OUDEN AFHKEN AUTW ANUPOTAKTON NUN DE OUPW ORWMEN AUTW TA PANTA UPOTETAGMENA

<ch 2><v 9> TON DE BRACU TINA TI PAR AGGELOUS HLATTWMENON BLEPOMEN IN DIA TO PAQHMA TOU QANATOU DOXH KAI TEIMH TIMH ESTEFANWMENON OPWS CARITI QU VPER PANTOS GEUSETAI GEUSHTAI QANATOU

<ch 2><v 9> TON DE BRACU -----TI PAR AGGELOUS HLATTWMENON BLEPWMEN IN DIA TO PAQHMA TOU QANATOU DOXH KAI ------TIMH ESTEFANWMENON OPWS CARITI QU UPER PANTOS ---------GEUSHTAI QANATOU

<ch 2><v 10> EPREPEN GAR AUTW DI' ON TA PANTA KAI DI' OU TA PANTA POLLOUS VIOUS EIS DOXAN AGAGONTA TON ARCHGON THS SWTHRIAS AUTWN DIA PAQHMA TWN TEL-IWSAI

<ch 2><v 10> EPREPE- GAR AUTW DI- ON TA PANTA KAI DI- OU TA PANTA POLLOUS UIOUS EIS DOXAN AGAGONTA TON ARCIGON THS S---RIAS AUTWN DIA PAQHMA TWN TELEIWSAI

<ch 2><v 11> O TE GAR AGIAZWN KAI OI AGIAZOMENOI EX ENOS PANTES DI' HN AITIAN OUK EPESCUNETAI EPAISCUNETAI ADELFOUS AUTOUS KALIN KALEIN

<ch 2><v 11> O TE GAR AGIAZWN KAI OI AGIAZOMENOI EX ENOS PANTES DI- HN AITIAN OUK ------------EPAISCUNETAI ADELFOUS AUTOUS ------KALEIN

<ch 2><v 12> LEGWN APAGGELW TO ONOMA SOU TOIS ADELFOIS MOU EN MESW EKKLHSIAS VMN HSW SE

<ch 2><v 12> LEGWN APAGGELW TO ONOMA SOU TOIS ADELFOIS MOU EN MESW EKKLHSIAS UMN HSW SE

 

 

<ch 2><v 13> KAI PALIN EGW ESOMAI PEPOIQWS EP AUTW KAI PALIN JDOU EGW KAI TA PAIDIA A MOI EDWKEN O QS

<ch 2><v 13> KAI PALIN EGW ESOMAI PEPOIQWS EP AUTW KAI PALIN JDOU EGW KAI TA PAIDIA A MOI EDWKEN O QS

<ch 2><v 14> EPI EPEI OUN TA PAIDIA KEKOINWNHKEN AIMATOS KAI SA--RKOS KAI AUTOS PARAPLHSIWS METESCEN TWN AUTWN PAQHMATWN JNA DIA TOU QANATOU QANATON KATARGHSH TON TO KRATOS ECONTA TOU QANATOU TOU-T ESTIN TON DIABOLON

<ch 2><v 14> ----EPEI OUN TA PAIDIA KEKOINWNHKE SA--RKOS KAI -AIMATOS KAI AUTOS PARAPLHSIWS METESCEN TWN AUTWN ----------JNA DIA TOU QANATOU --------KATARGHSH TON TO KRATOS ECONTA TOU QANATOU TOU T-ESTIN TON DIABOLON

<ch 2><v 15> KAI APALLAX-H TOUTOUS OSOI FOBW QANATOU DIA PANTOS TOU ZHN ENOCOI HSAN DOULIAS DOULEIAS

<ch 2><v 15> KAI APALLAXEI TOUTOUS OSOI FOBW QANATOU DIA PANTOS TOU ZHN ENOCOI HSAN --------DOULEIAS

<ch 2><v 16> OU GAR DHPOU AGGELWN EPILAMBANETE EPILAMBANETAI ALLA SPERMATOS ABRAAM EPILANBANETAI

<ch 2><v 16> OU GAR DHPOU AGGELWN -------------EPILAMBANETAI ALLA SPERMATOS ABRAAM EPILAMBANETAI

<ch 2><v 17> OQEN WF-ILEN KATA PANTA TOIS ADELFOIS OMOIWQHNAI JNA ELEHMWN GENHTE GENHTAI KAI PISTOS ARCIEREUS TA PROS TON QN EIS TO EILASKESQAI ILASKESQAI TAS AMARTIAS TOU LA OU

<ch 2><v 17> OQEN WFEILE- KATA PANTA TOIS ADELFOIS OMOIWQHNAI  JNA ELEHMWN -------GENHTAI KAI PISTOS ARCIEREUS TA PROS TON QN EIS TO ------------JLASKESQAI TAS AMARTIAS TOU LA OU

<ch 2><v 18> EN W GAR AUTOS PEPONQEN PIRA-SQIS PEIRASQEIS DU-NATAI TOIS PEIRAZOM ENOIS BOHQHSAI

<ch 2><v 18> EN W GAR ------PEPONQEN----AUTOIS PEIRASQEIS DU NATAI TOIS PEIRAZOM ENOIS BOHQHSAI

<ch 3><v 1> OQEN ADELFOI AGIOI KLHSEWS EPOURANIOU METOCOI KATANOHSETE KATANOHSA TAI TON APOSTOLON KAI ARCIEREA THS OMOLOGIA- HMWN IN CN

<ch 3><v 1> OQEN ADELFOI AGIOI KLHSEWS EPOURANIOU METOCOI KATANOHS-------A---- T-E TON APOSTOLON KAI ARCIEREA THS OMOLOGIAS HMWN IN CN

<ch 3><v 2> PISTON ONTA TW POIHSANTI AUTONWS KAI MW-SHS EN OLW TW OIKW AUTOU

<ch 3><v 2> PISTON ONTA TW POIHSANTI AUTONWS KAI MWUSHS EN OLW TW OIKW AUTOU

 

 

<ch 3><v 3> PLIONOS PLEIONOS GAR -OUTOS DO-XHS PARA MWUSEWS MWSHN HXIWTAI KAQ OSON PLIONA PLEIONA TIMHN ECEI TOU OIKOU -O KATA-SKEUASAS AUTON

<ch 3><v 3> --------PLEIONOS GAR DO-XHS- OUTWS PARA MWU-------SHN HXIWTAI KAQ OSON -------PLEIONA TIMHN ECEI TOU OIKOU  O KATA SKEUASAS AUTON

<ch 3><v 4> PAS GAR OIKOS KATASKEUAZETE KATASKEUAZETAI VPO TINOS O DE TA PANTA KATASKEUASAS QS ------------

<ch 3><v 4> PAS GAR OIKOS --------------KATASKEUAZETAI UPO TINOS O DDE TA PANTA KATASKEUASAS QS KATASKEUASAS

<ch 3><v 5> KAI MWVSHS MEN -------PISTOS EN OLW TW OIKW ------AUTOU WS QERAPWN EIS MARTURION TWN LALHQHSOMENWN

<ch 3><v 5> KAI MWUSHS MEN PISTOS PISTOS EN OLW TW OIKW AUTOU AUTOU WS QERAPWN EIS MARTURION TWN LALHQHSOMENWN

<ch 3><v 6> CS DE WS VIOS EPI TON OIKON AUTOU OS OU OIKOS ESMEN HMIS HMEIS EAN EANPER THN PARHSIAN PARRHSIAN KAI TO KAUCHMA THS ELPIDOS -MECRI TELOUS BEBAIAN KATASCWMEN

<ch 3><v 6> CS DE WS --US EPI TON OIKON AUTOU ---OU OIKOS ESMEN -----HMEIS ----EANPER THHN ---------PARRHSIAN KAI TO KAUCHMA THS ELPIDOS  MECRI TELOUS BEBAIAN KATASCWMEN

<ch 3><v 7> DIO KAQWS LEGEI TO PNA TO AGION SHMERON EAN THS FWNHS AUTOU AKOUSHTE

<ch 3><v 7> DIO KAQWS LEGEI TO PNA TO AGION SHMERON EAN THS FWNHS AUTOU AKOUSHTE

<ch 3><v 8> MH SKLHRUNHTE TAS KARDIAS VMWN WS EN TW PARAPIKRASMW KATA THN HMERAN TOU PIRASMOU PEIRASMOU EN TH ERHMW

<ch 3><v 8> MH SKLHRUNHTE TAS KARDIAS UMWN WS EN TW PARAPIKRASMW KATA THN HMERAN TOU ---------PEIRASMOU EN TH ERHMW

 

 

 



[1] Quando algo é bom e ruim ao mesmo tempo dependendo do ponto de vista adotado.

[2] Amanuense era todo aquele que copiava textos ou documentos à mão.

A palavra amanuense provém do latim amanuensis.

 

[3] Textus Receptus: Manuscrito bíblico muito difundido.

[4] Filogenia ou filogênese descreve a origem e a evolução das espécies. A tarefa principal dos filogenistas é determinar os relacionamentos ancestrais entre espécies conhecidas (tanto as que vivem quanto as extintas).

 

[5] A Filologia - do grego philos (Amor) logía (Literatura) - é o estudo dos textos e das linguagens antigas.Baseando-se no registro documental de textos antigos, o filólogo pode traçar o desenvolvimento de uma linguagem humana ou da expressão de um povo.

[6] Papiro (Cyperus papyrus ; Cyperaceae) é uma planta aquática da mesma família da Tiririca (Cyperus rotundus), que é a planta daninha mais difundida do mundo, segundo o Guiness Book. Ela é considerada sagrada e fartamente encontrada no delta do Nilo. Era utilizada principalmente na produção de papel no Egito antigo.

 

[7] Pergaminho (do grego pergaméne e do latim pergamina ou pergamena), é o nome dado a uma pele de animal, geralmente de cabra, carneiro, cordeiro ou ovelha, preparada para nela se escrever. Designa ainda o documento escrito nesse meio. Foi largamente utilizado na antiguidade ocidental, em especial na Idade Média, até à difusão da invenção chinesa do papel.

 

[8] O Escriba era a pessoa na Antiguidade que dominava a escrita e a usava para, a mando do regente, redigir as normas do povo daquela região ou de uma determinada religião.

[9] Amanuense era todo aquele que copiava textos ou documentos à mão.

A palavra amanuense provém do latim amanuensis.

 

[10] Texto onde as letras apresentavam-se somente em maiúsculas sem espaços entre as palavras.

[11] Ocorre quando o amanuense está copiando ao fim da linha, molha a pena e, quando volta a copiar, copia o texto a partir de outra linha abaixo que tem a mesma terminação na linha.

 

[12] Palavras que a pronuncia é igual.

 

[13] Palavras em que a escrita é igual.

[14] Expressões lingüísticas relacionadas ao povo judeu

[15] Erro de sintaxe

[16] De Deus ou do Senhor em Grego

[17] Qualquer "deturpação" de sistemas filosóficos instituídos, ideologias políticas, paradigmas científicos, movimentos artísticos, ou outros. Ao fundador de uma heresia dá-se o nome de heresiarca, seguidores são hereges.

[18] Uma recensão é um trabalho de apresentação de uma obra literária, concentrando-se no seu conteúdo e no contexto em que a obra surge a público.

[19] Cesareia Palestina, também chamada Cesareia Marítima, uma cidade construída por Herodes, o Grande, cerca de 25 - 13 AEC, situa-se na costa mediterrânica de Israel, a cerca de meio caminho entre Telavive e Haifa, num local anteriormente chamado Pyrgos Stratonos ("Strato" ou "Torre de Straton", em Latim Turris Stratonis). Cesareia Palestina não deve ser confundida com outras cidades batizadas em honra de César, como Caesarea Philippi, também na Palestina, ou Caesarea Mazaca na Capadócia anatólica.

[20] A cidade de Antioquia-nos-Orontes (moderna Antaquia) situa-se na actual Turquia. Foi fundada nos finais do século IV a.C. por Seleucus I Nicator, que a fez capital do seu império na Síria. Seleucus I tinha servido como um dos generais de Alexandre, o Grande, e o nome Antiochus ocorria frequentemente entre membros da sua família.

 

[21] “Um exame cuidadoso dessas referencias conduz ao seguinte catalogo de manuscritos de papiros e manuscritos unciais que cobrem o livro de Hebreus: P12, P13, P17, P46, P79, P89, U1, U2, U3, U4, U6, U15, U18, U20, U25, U44, U48, U56, U75, U122, U142, U150, U151, U227, U228, U243, U252, U278, U280, and U285. O processo pelo qual essa lista foi compilada não foi tão direto como esse sumário indica. Alguns manuscritos somente foram adicionados como resultado de informação obtida do instituto de pesquisa textual do Novo testamento em Münster na Alemanha.” (FINNEY, 2005)

Hosted by www.Geocities.ws

1