|
1.
Expansión europea y Revolución industrial.
De SOLO EN CASA.
En general, la ciencia del XVIII se ha dividido en dos épocas: hasta 1750
proceso de introducción de las ideas de Newton en el continente y la segunda
mitad vinculada a la Ilustración (hitos más destacables: sistemética de
Linneo, diversificación de la física experimental y revolución química de
Lavoisier).
Los puntos esenciales son:
a) desarrollo de la obra de Newton en manos de los geómetras de la
segunda mitad de siglo
b) desarrollo de las ciencias de la vida por clasificación y
temporalidad
c) desarrollo de experimentos pneumáticos que desembocarán en la
revolución química
d) triunfo de la matematización en física, búsqueda de la exactitud.
El espíritu científico ilustrado persigue la sistematización, las
concepciones globales y la reducción de la diversidad a pocas causas. El
movimiento romántico, a finales de siglo, perseguirá con mayor ahínco la
búsqueda de la unidad propia aunque no en todas las disciplinas (teoría
celular, electromagnetismo, temporalización de las ciencias de la vida y el
planeta).
En la primera etapa se da una institucionalización de las Academias
propiciadas por los estados según el modelo francés, mientras que en la
segunda hay un fuerte resurgir de las universidades y escuelas técnicas.
Durante todo el periodo los científicos tienden a profesionalizarse,
asociarse y especializarse: paso del filósofo natural al ‘científico’.
Durante este periodo queda además vinculada la ciencia definitivamente al
desarrollo económico (máquina de vapor).
Características básicas del periodo:
1) confianza en el poder ilimitado de la razón
2) la naturaleza cumple sus leyes naturales y su conocimiento posibilita
el progreso
3) culminación de la expansión marítima europea (determinación de la
longitud: cronómetro, sextante y tablas lunares) y establecimiento de una red
comercial colonial.
4) la tecnología sigue por delante de la ciencia (máquina de vapor, mecanización
textil y revolución del hierro) pero se establecen unas nuevas relaciones de
intercambio entre ambas.
MASON, vol. 3, Cap. 1 («La aplicación de la ciencia
durante el siglo XVIII»)
El problema de la longitud y el observatorio de Greenwich (1676). Flamsteed y
las tablas celestes (1725). La construcción de relojes precisos (Harrison y
Le Roy).
El problema del drenaje de las minas. Fuente barata de energía. Máquina de
Savery, con vapor de agua (impelente) y vacío por condensación (succión)
(1698). Papin: primera olla a presión. Máquina atmosférica de Newcomen con
balancín, transforma calor en energía mecánica (1710).
Los ingenieros y fabricantes de instrumentos adoptan el método científico.
Smeaton es el primero. Watt adapta la máquina de Newcomen (condensador
independiente) para producir movimiento mecánico rotativo. La máquina de
vapor posibilita el desarrollo industrial (minería, textil, fundiciones de
hierro, etc.).
MASON, vol. 3, Cap. 2 («El trasfondo de la ciencia del
XVIII»)
Mientras los científicos del XVII desarrollaron instrumentos nuevos (tenian
interés por la ciencia pura y por la aplicada), los científicos del XVIII
fracasaron en sus empeños y fueron los ingenieros artesanos quienes lo
lograron (Watt, Harrison, Newcomen, etc.).
División por naciones del progreso científico: Ingalterra empírica (Bacon) y
Francia teórica (Descartes). La extracción social de los científicos también
se modifica sustancialmente: ya no es el noble ocioso sino el artesano
productivo, normalmente inconformista.
Creación de sociedades científicas provinciales (Sociedad Lunar de
Birmingham, Sociedad Literaria y Filosófica de Manchester, Sociedad
Filosófica de Edimburgo, etc.). Dos tradiciones: la escocesa, más teórica, y
la inglesa, más empírica.
MASON, vol. 3, Cap. 5 («La idea de progreso en el mundo
mecánico del XVIII»)
En los filósofos de los inicios del movimiento científico (Bacon, Descartes),
se aúnan la tradición del empirismo acumulativo con la de progreso de los
eruditos antiguos (Aristóteles). Sin embargo la difusión del newtonismo, hizo
que se abandonase la idea evolutiva, sustituida por otra idea mecanicista
(Leibniz: el mejor de los mundos posibles), que llegó a extenderse a la
doctrina social (Hobbes, Rousseau: contrato social primigenio). Las ideas de
progreso humano y de evolución de las especies eran inconcebibles.
La idea de progreso sólo se mantuvo gracias a la psicología que defendía que
la mente estaba condicionada por la fisiología (y por ello el avance de la
medicina haría progresar: Descartes, Lamettrie) y por factores externos (y la
educación podía mejorarla: Locke).
De la teoría psicológica de Locke derivaron tres problemas: 1) ¿cómo se
combinan los diferentes sentidos para producir una sensación única? (estudio
de los sentidos vista, tacto, etc.: Berkeley, Diderot, Condillac), 2) ¿cómo
se traducen las sensaciones a ideas? (semejanza, causalidad o proximidad:
Hume) y 3) ¿cómo se combinan las ideas entre sí? (explicación fisiológica por
los nervios: Hartley).
Los ilustrados franceses (Voltaire, Enciclopedia …) retoman la idea de
progreso indefinido de la humanidad. Esta idea de progreso en lo humano abrió
paso a la idea evolutiva en otros dominios: en el sistema solar (Laplace), en
la psicología (Cabanis), en la zoología (Lamarck). En Inglaterra también se
impuso, aunque por vía teológica (Hartley) secularizada por Priestley y
Erasmus Darwin (abuelo).
HANKINS ("Ciencia e Ilustración").
Las academias y sociedades científicas fueron el principal centro de
investigación en el XVIII ya que las universidades no se dedicaban a ello.
Tanto la Royal Society como la Academia de Ciencias de París fueron los
modelos sobre los que se crearon infinidad de sociedades por toda Europa. La
segunda, que era de carácter estatal y vinculada por ello al antiguo régimen,
no pudo sobrevivir a la revolución. Lavoisier y Condorcet perecieron junto
con ella en la guillotina.
Durante el siglo XVIII se empieza el desarrollo de la teoría matemática de la
probabilidad que tendrá gran utilidad en las ciencias humanas. Pascal, Fermat
y Huygens hacen estudios sobre los juegos y las apuestas. D'Alembert
considera exacta la teoría matemática de la probabilidad pero niega su
aplicación en la física. Laplace (1774) desarrolla la teoría inversa de la
probabilidad que Bernouilli había empezado a estudiar en 1713.
TATON ("Historia General de las Ciencias").
La importancia social de la ciencia (sus aplicaciones a la vida cotidiana),
que no había pasado desapercibida como demuestran la creación de sociedades
científicas, culmina en el siglo XIX con el desarrollo de la Política
Científica por parte de los gobiernos.
Es durante el siglo XIX que se fundan la mayoría de Academias (de Farmacia,
de Medicina, de Ciencias Naturales, etc.) que contribuyen al esfuerzo de
exigir de los gobiernos un apoyo decidido a la investigación. También es la
e´poca de constitución de las Asociaciones nacionales para el progreso de las
ciencias.
A nivel internacional se empiezan a crear comisiones (como el de Pesos y
Medidas) que crean una nueva dimensión en la historia de las relaciones
científicas internacionales.
2. La física en el siglo XVIII.
SOLO EN CASA.
Diferencias entre los Principia y la Optica de Newton: el primero es una
síntesis matemática sin veleidades ontológicas, la segunda es más abierta,
persigue matematizar un campo concreto, establece un programa de
investigación y sugiere una ontología de partículas.
La difusión de las ideas de Newton en el continente tuvo bastante
resistencia. Los torbellinos cartesianos eran problemáticos, pero más
problemático era aceptar la acción a distancia y el concepto de fuerza.
Finalmente se estableció un compromiso entre el mecanicismo cartesiano, la
fecundidad newtoniana y la influencia de Leibniz. Se cabará aceptando el
método y valorando las leyes naturales por encima de las causas interponiendo
entre ambos los fluidos sutiles.
Los fenómenos como el calor o la electricidad dejan de verse
especulativamente para analizarse concienzudamente.
El concepto de Física pasa de ser el estudio de la naturaleza por sus causas,
a estudiar la naturaleza inanimada. La nueva física experimental será una
disciplina de la medida (no del modelo matemático). Sus grandes temas serán
el calor, la luz, la electricidad y el magnetismo.
Tres etapas en la labor experimental: 1) cualitativa, tendente a mostrar los
fenómenos, 2) cuantitativa, se empiezan las mediciones mediante el apoyo de
modelos teóricos y 3) teórica, la experimentación pasa a depender de la
teoría.
Evolución de los estudios sobre el calor
Stephen Hales: propiedades del supuesto fluido calórico, por la
descomposición de sustancias mediante calor.
Amontons: diseño del termómetro de aire.
Hermann Boerhaave: estudio de la naturaleza del fuego, corpúsculos en rápido
movimiento; calor, luz y electricidad son formas de fuego.
Fahrenheit y Reaumur: desarrollo de la termometría.
Robert Black y Johann Wilcke: conceptos de calor específico y latente.
Conde Rumford: experimentos que contradicen el calórico.
Carnot: teoría del ciclo de Carnot.
Evolución de los estudios sobre electricidad.
Stephen Gray: descubre la conducción eléctrica, pone de manifiesto su
naturaleza fluídica.
Cisternai Dufay: existencia de dos tipos de electricidad, dos tipos de
fluidos eléctricos.
Franklin: explica la existencia de dos electricidades por la cerencia o
abundancia del fluido.
Introducción de la botella de Leiden: nuevos proceso experimentador con
mediciones.
Galvani: la ‘electricidad animal’.
Volta: descubrimiento de la pila eléctrica.
Evolución de la mecánica.
Euler: formulación de los principios del momento lineal y angular y de los
conceptos de presión y de esfuerzo.
Lagrange: desarrollo del formalismo más estricto
Evolución de la astronomía.
Irresolubilidad del problema de los n cuerpos. Mejora de los instrumentos
(miras telescópicas, objetivo acromático, cuarto de círculo mural, etc.).
Gran mejora en la determinación de las posiciones de las estrellas. Inicio de
la geodesia (verificación del principio de achatamiento de Newton).
Euler, Clairaut y d’Alembert: estudio del sistema lunar (Luna bajo influencia
de Sol y Tierra).
Lagrange y Laplace: descubrimiento de que las anomalías tienen carácter
periódico.
Bradley: descubrimiento de la aberración y la nutación.
Wright, Kant y Lambert: identifican la Vía Láctea como estructura de orden
superior.
Herschel: telescopio reflector, descubre Urano.
MASON, vol. 3, Cap. 3 («La astronomía y la filosofía
newtoniana en el dieciocho»).
La teoría newtoniana no experimenta avances significativos en la primera
mitad del XVIII, sólo estudios de sus aplicaciones (Halley) y defensas de los
ataques de Berkeley, que significan avances en la fundamentación del cálculo.
En Francia, Fontenelle, defiende el espíritu geométrico (cartesiano).
Voltaire introduce las ideas de Newton. Lo newtonianos franceses aportarán
desarrollos detallados de problemas concretos: Euler (cálculo), Clairaut (los
tres cuerpos), Lagrange y Laplace (estabilidad del sistema solar, calculador
divino), Bonnet (psicología).
Los ingleses hacen importantes trabajos observacionales y experimentales:
Bradley (estrellas fijas: aberración de la luz y nutación del eje terrestre),
Maskelyne (masa de la tierra), Wright (vía láctea), Herschel (Urano,
estrellas dobles, nebulosas).
SELLES, «Astronomía y navegación en el siglo
XVIII».
La teoría de Newton suministraba una explicación de la mecánica del sistema
solar, pero no se disponía de estructura teórica alguna del fondo celeste.
Los catálogos de estrellas, con sus posiciones exactas eran el primer paso
para avanzar. Éstos fueron posibles gracias a la mejora de los instrumentos
de medición: Euler, D'Alembert y Clairaut estudian la óptica geométrica que
permite mejorar los telescopios; Herschel desarrolla el telescopio reflector,
Mayer la teoría de los errores; aparecen los cronómetros de precisión, etc.
Con todo ello Flamsteed elabora el mapa estelar del hemisferio boreal en 1722
con 3000 estrellas y una precisión de 10 segundos de arco. En 1763 La Caille
elabora el del hemisferio boreal con unas 10000 estrellas.
Herschel, en 1781, descubre con sus nuevos telescopios Urano. Pero el
objetivo de herschel era más ambicioso: quería descubrir la estructura del
cosmos y para ello precisaba conocer no sólo la posición aparente en el cielo
de las estrellas sino su distancia a la tierra. Lo intentó por dos vías (la
luminosidad y el paralaje) presentando en 1782 un catálogo de 269 estrellas
dobles cuyo estudio coincidía con la teoría newtoniana, lo cual fue la
primera prueba de que dicha teoría se extendía a todo el universo. También
descubrió que el Sol no se hallaba quieto y los cúmulos y nebulosas.
TEN, «La física ilustrada».
La física del XVIII es todavía una amalgama de determinismo cartesiano,
escolasticismo, charlatanería, etc. por lo que los científicos de la época
empiezan a llamarla física ‘matemática’ o física ‘experimental’, que
coincidiría con lo que hoy llamamos física tout court. Las teorías de Newton
se irán imponiendo a lo largo del XVIII sobre el escolasticismo y el
cartesianismo. La historia de la física en el XVIII es la historia de esta
progresión cuyos propagandistas fueron tanto filósofos (como Voltaire o
Maupertuis) como científicos (como Bernouilli, Gravesande o el propio
Leibniz).
No puede entenderse el progreso de la física sin el de la matemática y, en
concreto, del desarrollo del cálculo infinitesimal. Porque la geometría
euclídea y los análisis arquimedianos eran el lenguaje de la estática y el
cálculo diferencial será el lenguaje de la dinámica.
Características de la ciencia en el XVIII: 1) La razón como nueva religión
(deísmo y ateísmo), 2) Utilidad de la ciencia (maquinismo, revolución
industrial, tímida movilidad social) y 3) Popularización de la ciencia
(difusión de conocimientos, sobre todo al ámbito militar y tecnológico).
Francia será el centro del proceso, Mientras que Gran Bretaña la aventajará
en algunas técnicas especiales como la navegación.
La mecánica del punto y del sólido: Euler es el verdadero creador de la
mecánica racional, ya que Newton no había ido más allá de ña mecánica del
punto. Su continuador será D'Alembert y llegará a su coronación con Lagrange,
con quien los principios de conservación y los principios de mínimo se
convertirán en los principios fundamentales de la mecánica.
La mecánica de fluidos: Jean y, su hijo, Daniel Bernouilli serán los padres
de la hidrodinámica definiendo los conceptos de presión elemental y
macroscópica, de velocidad, de zonas, de flujos y otros que utilizarán los
investigadores posteriores. Incluso hace una primera aportación a la teoría
cinética de los gases al afirmar que un fluído elástico no es m´s que un
conjunto de corpúsculos "que se agitan de aquí para allá con movimientos
rápidos". D'Alembert y Euler serán su más significativos continuadores,
estudiando problemas concretos o sintetizando los principios generales.
La hidrodinámica práctica: los problemas teóricos de la hidrodinámica tenían
en aquella época una aplicación inmediata en la construcción naval por lo que
se aplicó la matemática para buscar las mejores características de los
navíos. Después de varias aportaciones de Huygens, Bernouilli y otros, es
Pierre Bouguer (1727) quien publica "La naturaleza de las naves"
donde realiza un completo estudio matemático del movimiento de los barcos.
También Euler intervino con un tratado en 1749 en que, fundándose en unos
pocos principios empíricos y sus desarrollos de la mecánica newtoniana,
intentaba resolver el problema de la forma idónea de los buques y sus
interacciones con el agua y el viento; sin embargo, sus principios empíricos
estaban alejados de la práctica cotidiana de los marineros y capataces. Será
Jorge Juan (1771) quien con su Examen Marítimo conjugue ambos mundos, el
teórico y el práctico, con éxito. Benito de Bails (un protegido de Jorge
Juan) en sus Elementos de Matemática (si no el más original, sí el más
completo de los tratados de matemática experimental del XVIII) completará el
estudio con la hidrodinámica de los circuitos de agua, tan necesaria para las
obras de riego público.
La figura de la Tierra: la consideración de Newton de una tierra achatada por
los polos (deducida de sus principios) contrastaba con las mediciones de los
hermanos Cassini (1718) lo que fue utilizado por los cartesianos. Desde 1736
a 1745 y a propuesta de Maupertuis, la Academia de Ciencias de París
(mayoritariamente cartesiana) realizó sendas mediciones en Laponia (dirigida
por el propio Maupertuis y con Clairaut, Le Monnier y Camus) y en el
virreinato de Perú (compuesta por Godin, Bouguer, La Condamine, Jorge Juan y
Antonio de Ulloa). Naturalmente, Newton tenía razón. La expedición peruana
realizó además numerosas observaciones barométricas, sobre refracción de la
luz, la velocidad del sonido y otras. De la primera expedición fue Clairaut
quien publicó un tratado matemático exquisito en el que introdujo la
trigonometría del esferoide y está en el origen de la geodesia.
La óptica: Newton había defendido la teoría corpuscular de la luz contra la
ondulatoria de Huygens. Sin embargo el problema en el siglo XVIII no es
conceptual: se puede estudiar la luz (dióptrica y catóptrica) sin hacer
referencia a su naturaleza. El problema de los telescopios (refractor:
aberración cromática y reflector: dificultad de construcción) se convierte en
un reto teórico. Los vidrios de plomo solucionaron el problema cromático, por
lo que Euler empezó a mostrarse partidario de la teoría ondulatoria. Otro
problema sobre la luz fue el de la medición de su intensidad (astronomía) al
que dedicaron estudios Lambert y Bouguer diseñando fotómetros.
El termómetro: Farenheit (Danzig 1714) termómetro de mercurio establece los
puntos fijos (tema ya planteado por Galileo) en una mezcla de amoníaco y
hielo (0) y temperatura del cuerpo humano (96). Reaumur (1730) termómetro de
alcohol pasa de 1000 a 1080 cc del hielo fundente al agua hirviente. Celsius
finalmente propondrá el 100 y el 0 para que Linneo lo invierta. Los
termómetros de gas (más perfectos que los del siglo XVII) llevarán al francés
Amontons a plantear la idea del 0 absoluto (-239º) que Lambert corregirá a
-270º. Gay Lussac estudiará la relación presión/temperatura que le conducirá
a la ley de su nombre. Black establecerá la idea de calor específico de cada
elemento para distinguir la capacidad de calentarse de las distintas
materias.
La electricidad y el magnetismo: von Guericke construye la primera máquina
para producir electricidad (una bola de azufre rodando entre almohadillas),
Hauksbee sustituye el azufre por cristal, Gray estudia los efectos y descubre
la conductividad de determinadas sustancias. Nollet distingue entre dos
electricidades (vítrea y resinosa). Musschenbroeck descubre la botella de
leyden en 1745 con von Kleist que permite acumular la electricidad (estamos
en teorías fluidistas). Hasta la construcción de los primeros electrómetros no
se puede desarrollar una teoría matemática de la electricidad que será
acometida por Franklin con su teoría del fluido único. Pero fueron Cavendish
y Coulomb quienes la desarrollarían totalmente a fines de siglo con una ley
de atracción y repulsión ‘newtoniana’.
Los fluidos sutiles: un cómodo cajón de sastre del que sacar a voluntad las
piezas necesarias para explicar determinadas propiedades experimentalmente
descubiertas en la electricidad, el magnetismo, la luz, el fuego y también el
calor.
La introducción del newtonianismo en el continente se realiza a través de la
Universidad de Leyden en Holanda (Gravesande y Musschenbroeck), por Christian
Wolff (un leibniziano) en Alemania y por Maupertuis y Voltaire en Francia. La
física experimental llegó a convertirse en un espectáculo popular más cercano
a la magia que a la ciencia.
A finales del siglo XVIII, el newtonianismo era el modelo al que todas las
ciencia pugnaban por asimilarse. Se cierra con ello un capítulo importante de
la historia de la ciencia. La física ilustrada consiguió transformar el
cosmos mecanicista en un mundo matemático.
3. La revolución química.
SOLO EN CASA.
La química de las afinidades surge de la obra de Newton. Ésta transformó la
química de las substancias en química de las reacciones; sus tablas
constituyen una clasificación de datos empíricos que alcanza su cima con
Bergman (1775-1783).
La teoría del flogisto desempeña un papel unificador y racionalizador
mientras la química de las sales se convierte en un medio de identificación
de las substancias.
La química de los gases, a partir del descubrimiento del co2 por Black,
conducirá al descubrimiento del oxígeno (Scheele) y a la determinación de sus
propiedades (Priestley).
Lavoisier marca la separación entre la vieja y la nueva química, la química
de principios y la química de elementos. una nueva química inteligible, con
nomenclaturas claras.
El carácter retardado y aislado de la revolución química que se modela a
imagen de la física experimental.
MASON, vol. 3, Cap. 4 («La teoría del flogisto y la
revolución química).
Boyle no inicia una tradición química. La iatroquímica alemana florece con la
teoría del flogisto, elemento esencial de todos los cuerpos combustibles. La
discusión sobre el flogisto centra la primera mitad del siglo XVIII, lo cual
muestra el alejamiento entre la química y la física y filosofía mecánica.
Black demuestra a mediados del XVIII la existencia del dióxido de carbono
(aire fijado) y su relación con los carbonatos. Durante la segunda mitd del XVIII
se descubrirán muchos otros gases: hidrógeno (Cavendish), amoníaco, oxígeno,
nitrógeno, etc. (Priestley y Schheele).
La figura central del período es Lavoisier (guillotinado en 1794) quien se
establece un programa de investigación para superar las contradicciones de
las teorías anteriores. Primero descubre que la calcinación de los metales es
una combinación de metal y aire. En 1783 anuncia su descubrimiento
revolucionario: la combustión es una combinación química de la sustancia
combustible con el oxígeno (aire desflogistizado). Eleva el oxígeno a
principio explicativo general. Revoluciona también la nomenclatura química.
Afirma que el agua es un compuesto de hidrógeno y oxígeno (a partir de los
experimentos de Priestley)
Tierra, aire, agua y fuego dejan de considerarse sustancias elementales.
Nueva definición de elemento químico: el término efectivo al que ha llegado
el análisis químico (Lavoisier).
BABOR - IBARZ ("Química General
Moderna").
A Stahl se le debe la teoría del flogisto que, aunque falsa, tiene el mérito
de ser la primera en explicar los fenómenos de la combustión y la reducción.
Según ésta, los materiales combustibles contienen un elemento sutil (el
flogisto) que al quemarse se desprende acompañado de luz y calor dejando un
residuo (una cal). Cuanto más combustible es un material más flogisto
contiene y por ello, también puede explicarse la reducción ya que al calentar
el residuo con carbón (rico en flogisto) se puede volver a obtener el
material inicial. El problema más grave era que algunos materiales al
quemarse (metales) aumentaban de peso con lo que se supuso que el flogisto
tenía peso negativo. Otro problema era la necesidad de presencia de aire para
la combustión.
TATON ("Historia General de las Ciencias").
Boyle introdujo la idea de la constitución corpuscular de la materia y, con
ella, la noción de afinidad, pero no dejarán de buscarse un agente universal.
El flogisto de Stahl es uno de dichos intentos. El químico Becher afirmaba
que el agente universal no podía ser otro que el fuego. Stahl, médico y
discípulo de Becher, ideará el flogisto como fuego/principio (no
fuego/material). El flogisto pertenece a la misma clase de fluidos sutiles
que eran aceptados en otras áreas de la ciencia y además no entraba en
conflicto con ninguna de las grandes metafísicas (cartesiana, atomista o
newtoniana).
Lavoisier empezó a poner en duda la existencia del flogisto en 1777 con
moderación que fue disminuyendo hasta que en 1785 presentó en la Academia sus
Reflexiones sobre la flogística.
HANKINS ("Ciencia e Ilustración").
La revolución química fue más la creación de una nueva ciencia que un cambio
en la existente. La química había sido cosa de médicos y farmacéuticos
(Boerhaave, Stahl, Black). Pero la revolución industrial demanda productos
químicos de forma creciente, el propio Lavoisier estudiará la cal y la
pólvora con fines prácticos. Siguiendo a Newton se habían elaborado las
tablas de afinidad pero no se penetró en las propiedades y procesos
químicos.
La constatación crucial de la revolución científica fue que el aire no era un
elemento simple, sino que muchas sustancias podían adquirir el estado gaseoso
y elpropio aire era una mezcla de varios elementos. Otro factor importante
fue el estudio del fuego (que nunca llegó a buen fin) pero que estaba
involucrado en todas las reacciones químicas.
En 1757 Black descubre el ‘calor latente’, el fuego se podía fijar en la
materia igual que el aire. Ello sugería analogías. El fenómeno de la
evaporación también contradecía muchas de las ideas establecidas desde
Aristóteles. Turgot establecerá el término expansibilidad en un artículo para
la Enciclopedia sugiriendo que los estados de la materia dependen de su
temperatura y que cualquier elemento puede estar en los tres estados (sólido,
líquido o gaseoso) dependiendo del calor. Lavoisier empezará sus experimentos
con la combustión en 1772 utilizando estas ideas.
Black estudia la cal y la magnesia y su comportamiento en la combustión y al
ser tratadas con ácidos, llegando a la conclusión que ambas materias
contienen aire fijado, pero que dicho aire tenía unas propiedades muy
especiales (era CO2). Al establecerse la idea de que podían existir distintos
tipos de aire, muchos teóricos se pusieron a buscarlos: Cavendish aísla el
hidrógeno en 1766 y Priestley (1772-1774) descubrirá un buen número de ellos
(amoníaco, oxígeno, acido clorhídrico, óxido nitroso) aunque los bautizará
con nombres distintos (oxígeno = aire desflogistizado). Primera tunda a los
elementos aristotélicos: el aire es una mezcla, no un elemento.
Desde Boyle, se había establecido que el aire contenía algún elemento vital
que permitía la combustión, la calcinación y la respiración; pero el propio
Boyle y Hooke sabían que la pólvora ardía sin necesidad de aire, por lo que
se suponía que algunas materias también contenían este principio vital. De
esta idea procedió la teoría del flogisto.
Lavoisier empezará sus estudios sobre la combustión en 1772 provisto de
cuatro ideas básicas: (1) el papel del aire en la combustión del diamante, (2)
el aumento de peso en la calcinación de los metales, (3) la teoría del estado
gaseoso de Turgot y (4) algún conocimiento vago de la pneumática de los
británicos. Sus primeros estudios los realizó con el fósforo y el azufre,
llegando a la conclusión de que ambas sustancias absorbían aire al arder. Hoy
sabemos que el aire que se combina con el metal en la combustión (O2) no es
el mismo que se libera en la reducción (CO2), ello exigía la existencia de
diversos tipos de aires y que la atmósfera fuese una combinación de ellos;
pero ello hacía muy difícil conocer el papel del aire en la combustión.
Lavoisier no se deshace del flogisto sino que lo traslada al aire. Lavoisier
y Priestley calentaron plomo, estaño y escoria de mercurio en retortas
herméticas y cayeron en la cuenta que las retortas pesaban lo mismo antes que
después de la calcinación pero, en el caso de los metales, había menos aire
en la retorta y en el caso de la escoria (óxido de mercurio) había más y este
exceso ardía con luz muy brillante.
Una vez obtenida una teoría más satisfactoria de la combustión, Lavoisier
estaba ansioso para aplicarla a otros campos. El primero de ellos fue la
explicación de la acidez producida por el aire desflogistizado, por lo que
propuso llamarle oxígeno (que produce acidez). Otro rompecabezas se resolvió
al descubrir Cavendish el hidrógeno (aire inflamable) que parecía arder sin
dejar residuo alguno, hasta que Priestley en 1781 lo quemó en recipiente
cerrado y obtuvo ‘rocío’ (agua). Informado Lavoisier por un ayudante de
Cavendish en 1783 de estos experimentos, llegó a la conclusión de que el agua
no era un elemento, sino la combinación de aire inflamable (hidrógeno) con
aire desflogistizado (oxígeno). Nueva tunda a Aristóteles. De la misma forma,
Lavoisier bautizó el gas con el nombre de hidrógeno (que produce agua).
El lenguaje químico fue reformado totalmente y la nomenclatura de Lavoisier
se ha impuesto hasta nuestros días (óxidos, ácidos icos y osos según la
cantidad de oxígeno que contenían, etc.). En su tratado Elemental de Química
(1789) Lavoisier, además de desprenderse de la teoría del flogisto, establece
dicha nomenclatura. Con él desaparecen todos los restos de alquimia
(influencias y esencias) para ser sustituidos por un análisis cuantitativo
estricto al estilo de la física. Los elementos (ya no aristotélicos) se
definen por sus propiedades químicas y se clasifican. Sólo el fuego se ha
resistido a dicho análisis y Lavoisier lo rebautizará como calórico, a la
espera de un mejor análisis que no se realizará hasta la termodinámica en el
XIX.
La teoría física del estado gaseoso lleva a Dalton a reintroducir el
atomismo, pero un atomismo que propugna que los átomos de cada elemento son
físicamente diferentes. Con ello pretende explicar el porqué de la estabilidad
de la mezcla atmosférica (los átomos de los distintos gases se ignoran, pero
se repelen los del mismo gas) y algunos fenómenos metereológicos. En Francia
se había desatado la polémica sobre las proporciones en que se combinan los
elementos: Proust defendía que las proporciones eran fijas, mientras
Berthollet defendía que dependían de las condiciones físicas. Al ir avanzando
la idea de las proporciones fijas, le dio a Dalton nuevas alas para defender
su teoría atomista de la materia y la idea de que los pesos atómicos de los
elementos darían con las proporciones de las combinaciones químicas. Ello no
fue posible de establecer, ya que existía todavía confusión sobre qué eran
elementos, qué eran mezclas y qué eran combinaciones y además algunos
elementos se podían combinar de distintas maneras (ácidos sulfúrico y
sulfuroso).
BROCK, Historia de la Química (Pgs 80-89 y Cap. 3 Los
elementos químicos).
Newton se interesó por la química aunque sólo publicó un artículo sobre ella.
Tiene numerosas referencias en los Principia y en la Óptica. Influenciado por
Boyle y van Helmont, se adscribe a la filosofía corpuscular añadiendole unas
fuerzas de atracción y repulsión para explicar las afinidades.
En el siglo XVIII las tablas de afinidades se hicieron comunes (Geoffroy,
Bergman, etc.). Buffon las identificará en 1785 con la atracción
gravitacional.
Stahl, retomando la idea de las tres tierras de Becher (terra fluida, pinguis
y lapidea), llama a la segunda (pinguis) flogisto y afirma que las tres
tierras y el agua son los principios químicos de todas las cosas. Como que no
podía trabajar con las materias orgánicas (que se descomponían sin
posibilidad de recuperación) sólo estudia la química inorgánica. El flogisto
explicaba suficientemente los fenómenos conocidos de la combustión y tenía un
ciclo a través de las plantas para volver a la tierra, sin embargo no
explicaba por qué algunos metales ganaban peso al ser quemados en el
aire.
Durante el siglo XVII la química abarca cuatro campos diferenciados: la
alquimia, la iatroquímica (Paracelso, van Helmont), la técnica experimental
artesana y el mecanicismo corpuscular (Boyle).
Lavoisier reestructuró la química desde sus principios fundamentales y la
dotó de un nuevo lenguaje y de nuevos objetivos. En 1773 se dedicó al estudio
de la historia de la química con el propósito de revolucionarla, pero su
estudio le llevó a la suposición de que el aire fijado (CO2) era el
reponsable de la combustión. Sin embargo la cal de mercurio (HgO) regeneraba
el metal al ser calentada sin adición de carbón (flogisto). Priestley habí
aislado el aire desprendido (O2) de esta calcinación y comprobó que
alimentaba la combustión mejor que el aire normal. Lavoisier llamó oxígeno
(generador de ácidos) a esta nueva substancia y la llamó "la parte más
sana y más pura del aire". En 1779 establece la teoría de la combustión
mediante el calórico contenido en el oxígeno que lo mantenía en estado
gaseoso y que, al fijarse en otras substancias, se desprendía produciendo
calor. Los metales formaban óxidos básicos y los no metales anhídridos
ácidos. Finalmente, en 1785 interpretó el agua como un compuesto de hidrógeno
(generador de agua) y oxígeno y atacó el concepto del flogisto; la teoría de
la combustión se funde con la teoría de la acidez. En 1789 fund la revista
Annales de Chimie y publica el Traité elementaire de chimie, en el que define
el elemento químico de forma pragmática y operativa (substancia no analizable
por medios químicos) y los clasifica en número de 33. El principal portavoz
de Lavoisier fue Furcroy quien publicó en 1800 el Systeme des connaisances
chimiques. Guyton (1787) propuso una sistematización del lenguaje químico: la
nueva nomenclatura era un compromiso con la nueva química.
Los seis rasgos fundamentales de la Revolución química:
1) aceptar que el aire participaba en las reacciones químicas: Hales
1727, Rouelle, Venel
2) abandonar la creencia de que el aire era un elemento: Black 1754,
Rutherford, Cavendish, Priestley
3) establecer el concepto de gas: Lavoisier
4) demostración de que los etales aumentan de peso con la calcinación:
Guyton 1771
5) transformación de las teorías de la acidez: Lavoisier
6) nueva teoría de la composición química y la organización de la
materia: Lavoisier
La química se aproximó al modelo de la física experimental (lenguaje preciso,
experimentación cuantitativa, etc.).
4. Las ciencias de la vida.
SOLO EN CASA.
Dos tradiciones en la historia natural: 1) como propedéutica de la
investigación científica, bajo la influencia de Plinio y Dioscórides da lugar
a los sistemas de clasificación que culminan en Linneo (no se interesa por
causas) y 2) como búsqueda de la comprensión causal, arrancando de los
escritos herméticos culmina en la obra de Buffon.
Las indagaciones empíricas británicas, con su afán clasificador y
recolectador, conducen a la sistemática artificial de Linneo.
Buffon atacará las clasificaciones de linneo, Tournefort y demás, defendiendo
una interpretación de la naturaleza por sus relaciones y procesos: linajes
animales históricos y teoría geológica secuencial.
El concepto de especie biológica se aborda desde dos perspectivas distintas:
1) la artificial (Linneo) a partir de unas pocas características morfológicas
y 2) la natural (Buffon, Jussieu, Adanson) a partir de la valoración de todos
los caracteres.
Esta segunda se ajustaba mejor a la idea de Gran Cadena del Ser que
desembocará en Lamarck y su teoría transformista de las especies.
La fisiología, por otra parte, se torna más empírica pasando a estudiar las
funciones de los órganos y no a describirlos solamente. No obstante se halla
bajo la influencia del idealismo alemán y del vitalismo francés.
El modelo mecanicista (cuerpo = máquina) cartesiano tuvo la virtud de
relacionar órganos con funciones y a la idea de organización del ser vivo.
Frente a la concepción mecanicista se hallaba la vitalista (Stahl) que
afirmaba que la diferencia radical entre la materia viva y la inerte radicaba
en una indetectable ‘anima sensitiva’.
Albrecht von Haller sistematiza la nueva disciplina y describe un diseño
organizativo del cuerpo: tres clases de tejido (conectivo, muscular y
nervioso) conforman las diversas partes del cuerpo cuya estructura define las
funciones de cada una de ellas.
En embriología existió la polémica entre epigénesis (Harvey) y
preformacionismo (Descartes). Los defensores de la primera (Buffon,
Maupertuis, Wolff) suponían una actividad inherente a la materia, mientras
los de la segunda (Needham, Spallanzani) defendían la preexistencia de un
patrón abstracto. El descubrimiento de la partogénesis de los pulgones
(Bonnet) y la regeneración del pólipo de agua dulce (Trembley) impulsaron
nuevamente las investigaciones.
A final de siglo las teorías de origen mecanicista (cartesiano o newtoniano)
son descartadas en aras de teorías de corte vitalista.
La idea de progreso ilustrada se traslada a las ciencias de la vida en el
periodo romántico y la Gran Cadena del Ser estática se convierte en temporal
justificándose los huecos por transformaciones adaptativas al medio (ley de
caracteres adquiridos de Lamarck). St.Hilaire (colega de Lamarck en el Museo
de Historia Natural) apunta que los distintos organismos son variantes de un
mismo tipo estructural (el desarrollo de unas partes significa la atrofia de
otras), dicha diversificación se produce por adaptación., pero rechaza la
idea de fuerza evolutiva. Cuvier (otro colega) sostenía lo contrario
afirmando que son los hábitos y las costumbres los que determinan la
estructura, existiendo diversos formas estructurales.
La embriología también se verá influenciada por la temporalidad, centrando su
investigación en las fases del desarrollo del embrión. Kielmeyer sugiere el
paralelismo entre desarrollo embrionario y ascenso en la cadena del ser.
Meckel formula la ley de la recapitulación genética. Von Baer se opone a ella
por el desarrollo embriológico divergente en las distintas especies.
A finales del XVIII resurge la vieja idea del glóbulo (célula) como elemento
fundamental de los seres vivos lo que abrirá un gran debate que se cierra en
1830 con la teoría celular de Schleiden y Schwann. La célula pasa de ser un
puro elemento estructural a un elemento funcional. Virchow destacará que la
célula es el punto de origen de la enfermedad
MASON, vol. 3, Cap. 6 («La evolución y la Gran Cadena del
Ser»).
Dos sistemas de clasificación de los animales en la época moderna:
artificiales (las especies orgánicas forman grupos diferenciados por una
característica específica) y naturales (los seres orgánicos se distribuyen en
un continuo jerárquico). Linneo adopta una clasificación artificial, mientras
que Buffon la adopta natural. Precedentes del s.XVII: Cesalpino, Malpighi y
Ray.
Carl Linneo, sueco, profesor de botánica en Upsala desde 1741. Tuvo gran
influencia, a él se debe la clasificación acutal.
Georges Buffon, francés, afirmaba que las clasificaciones artificiales eran
un error metafísico: no entender que los procesos naturales siempre tienen
lugar por grados. Acepta la idea de especie como grupo de individuos
interfértiles. Era un evolucionista a la inversa: las especies surgían por
degeneración.
Lamarck creía en la escala de criaturas y se negaba a creer que fuese
discontínua pero la existencia de fallos en dicha escala le obliga a
establecer la teoría de la influencia del medio (mutilaciones o uso de
órganos) como factor modificador de las características de las especies.
Lamarck inicia su clasificación por los organismos más simples. La
autodeterminación de las criaturas es un factor progresivo en la escala
evolutiva, de tal forma que los organismos inferiores se hallan totalmente
determinados por la naturaleza, mientras que los superiores (el hombre)
generan sus propias fuerzas rectoras. Lamarck lleva al mundo biológico la
idea de progreso y el dilema de las relaciones hombre/medio natural. Se le ha
descrito como el último de los philosophes, por su pensar especulativo,
aunque era notablemente más empírico que aquellos.
MASON, vol. 3, Cap. 7 («La filosofía de la naturaleza de
Alemania»).
Los naturalistas alemanes se rebelan contra el mecanicismo y materialismo
francés imperante en su disciplina. Goethe encabeza dicha rebelión. Los
alemanes se alinean con la concepción vitalista de la filosofía natural,
mientras que la dominante era la mecanicista (Descartes y Newton). La
corriente vitalista se basaba en las ideas de Paracelso (iatroquímica: todas
las sustancias están impregnadas de fuerza vital). Las ideas de Boehme y
Leibniz no tuvieron una influencia inmediata sobre los naturalistas alemanes
hasta principios del XIX (Schelling y Oken).
Jacob Boehme (1575-1624) dice que el hombre es un microcosmos autónomo,
autosuficiente como el cosmos universal. Ley triádica de desarrollo, mediante
oposición y resolución (azufre. Mercurio, sal), primera idea alemana de la
dialéctica del cambio expresada en lenguaje iatroquímico y místico.
Leibniz (1646-1716) también recibió influencias de los iatroquímicos
(Hellmont). Mundo compuesto por mónadas (centros no materiales de fuerza
vital) que no ejercían influjo fijo, creadas de forma armónica por un creador
único. Notar diferencia radical entre átomos (Newton: materia inerte, todos
iguales, etc) y mónadas (Leibniz: fuerzas espirituales, diferenciadas, etc.).
Tres clases de mónadas: vegetal, animal y racional.
Johann Herder (1744-1803), discípulo de Kant, postula que la escala de las
criaturas orgánicas constituye una secuencia histórica. La destrucción de
especies inferiores es prerequisito del desarrollo de especies
superiores.
Lorenz Oken (1779-1851), autor de los "Elementos de fisiofilosofía"
(1810), influido por Schelling. Reúne las teorías principales de Boehme y
Leibniz , añadiéndole la idea de que el universo es producto de un desarrollo
histórico. El hombre es la coronación del desarrollo de la naturaleza y
comprende en sí todo lo que le ha precedido. Si en el hombre se manifiesta la
autoconciencia (espíritu), la fisiofilosofía debe mostrar que las leyes del
espíritu no son distintas de las de la naturaleza. Todos los seres vivos se
componen de las mismas vesículas mucosas infusorias (células, mónadas en
forma material). La descomposición de un organismo suministra los órganos
constituyentes para la formación de otro basado en una forma ideal distinta.
Mientras la naturaleza es un fijación sucesiva de éter, el mundo orgánico es
una fijación sucesiva de vesículas mucosas infusorias. La teoría de las VMI
condujo a la teoría celular y en los 30’s las células pudieron verse al
microscopio.
MASON, vol. 3, Cap. 8 («La embriología: El desarrollo de
los organismos individuales»).
La embriología moderna nace con la obra de Harvey "De la generación de
los animales" (1651). Epigénesis embriológica. Su hipótesis de que todos
los animales procedían de huevos se confirmó en 1672 por Reiner de
Graaf.
1677, van Leuwenhoek descubre los espermatozoides de los machos. Con ello se
inician dos escuelas de preformacionismo: materno y paterno. El
preformacionismo estaba vinculado con el mecanicismo aunque no de forma
unívoca (excepciones: Leibniz era partidario del preformacionismo y Maupertuis
de la epigénesis).
Wolff en su "Teoría de la generación" (1759) criticará el
preformacionismo porque no se aprecia distinción de tejidos en el embrión.
Será contestado por von Haller quien afirmará que en el huevo se hallan
presentes los tejidos mediante una fina red invisible y también defenderá la
versión extrema del emboitement (todas las generaciones futuras están
contenidas en el ovario).
La doctrina epigenética se fue imponiendo progresivamente. Kielmeyer sugirió
un paralelismo entre el desarrollo embriológico y la escala de perfección de
los seres orgánicos.
A principios del XIX los filósofos de la naturaleza románticos eran todos
partidarios de la epigénesis. Los estudios empíricos empezaba a demostrar
(von Baer, 1827) que los huevos tenían diversas capas y que los tejidos
procedían en las distintas especies de las mismas capas: de la más exterior,
peil y sistema nerviosos; de la segunda, músculos y esqueleto; de la tercera,
vasos sanguíneos y de la más interior, el sistema alimenticio. Von Baer
también sostiene que las especies son producciones diferentes de una fuente
común y, con ello, empieza a cuestionar la ley biogenética.
Von Baer: postula las cuatro leyes: 1) los caracteres generales (del grupo)
aparecen en el embrión antes que los especiales (de la especie), 2) las
relaciones estructurales menos generales se forma después que las más
generales, 3) el embrión de una forma dada no pasa por el de otras formas
definidas sino que se separa de ellas y 4) el embrión de una forma animal
superior nunca se asemeja a la forma adulta de otro animal sino sólo a su
embrión.
MASON, vol. 3, Cap. 9 («La estructura y función de los
organismos vivos»).
Linneo, el famoso clasificador botánico, defendía (1764) los órdenes
artificiales de clasificación (basados en unas pocas características) en
lugar de los naturales (todas las características). La idea de que los seres
de una familia natural son variantes de una estructura general común, se iba
imponiendo.
St. Hilaire (1772-1844) sugiere que la naturaleza forma todas las criaturas
sobre la base de un plan simple: los óganos son homólogos en muchos animales,
aunque con grado distinto de desarrollo. En su Filosofía Anatómica (1818)
investiga las partes homólogas de diversos animales y concluye que todos los
animales están formados por el mismo número de partes (unidades de
construcción): el plan es único para todas las estructuras. Hilaire se
enfrenta al problema del origen de las diversas formas que explica mediante
la ley de compensación: la atrofia de unas partes beneficia el desarrollo de
otras. Suponiendo además que el medio físico (Lamarck) había conducido a
dicha diferenciación.
George Cuvier (1769-1832) recusó las opiniones de Lamarck y Hilaire afirmando
la teoría tradicional de que las especies animales habían sido fijadas en sus
formas actuales desde el inicio. En los animales hay un orden racional de
funciones y órganos que las realizan. Cuvier sugería que la clasificación de
los animales debería basarse en los órganos que realizan funciones principales
(principio de la subordinación de caracteres, Jussieu). Con esta base
estableció (1817) cuatro grupos fundamentales: vertebrados (mamíferos, aves,
reptiles y peces), moluscos (pulpo, caracol, ostra, etc.), articulados
(langostas, arañas, insectos, etc.) y radiados (estrella de mar). Se opone a
la cadena lineal de seres. Todos los órganos de una animal forman un
conjunto, actuando y reaccionando unas con otras; no puede modificarse uno de
ellos sin afectar al todo. Este análisis lo extendió a los huesos fósiles
reconstruyendo especies extinguidas tomando de Bonnet la teoría de las
catástrofes que habían asolado la tierra acabando con las especies de aquel
momento.
Lamarck, Hilaire y Cuvier tenían considerables diferencias de opinión.
Las especies animales forman una escala lineal evolutiva Lsi Hsi Cno
Las especies animales son modificaciones divergentes de cuatro tipos
estructurales Lno Hno Csi
La evolución es gradual y continua por adaptación al medio Lsi Hno Cno
La evolución es mutante sin referencia al medio Lno Hsi Cno
Los hábitos animales están determinados por su estructura anatómica
Lcontrario Hsi Ccontrario
Las adaptaciones estructurales de los órganos están provocadas por el medio
Lsi
Las adaptaciones estructurales de los órganos son mutuas dependiendo del
todo Hsi
MASON, vol. 3, Cap. 10 («La teoría celular»).
Siguiendo a Aristóteles, se consideraba hasta el siglo XIX que había tres
niveles en la organización de la materia orgánica: 1) cuatro elementos, 2)
tejidos (partes homogéneas) y 3) órganos (partes heterogéneas). La química de
Lavoisier sólo sustituyo los cuatro elementos por los elementos químicos.
Pero la corriente vitalista alemana introdujo las células orgánicas entre 1)
y 2).
La escuela de Montpellier desarrolló notablemente la clasificación de
materiales biológicos. En ella se basó Bichat (1771-1802) para clasificar 21
tipos de tejido (óseo, cartilaginoso, muscular, etc.), señalando que un
órgano se componía de varios tipos de tejido y que los órganos se agrupaban
en varios aparatos orgánicos que se unóan en dos complejos principales: el de
la vida vegetativa (crecimiento y nutrición, aparatos digestivo, respiratorio
y circulatorio) y el de la vida animal (movimiento y sensación, aparatos
nervioso, cerebral y muscular).
La teoría de Oken de las vesículas mucosas, llevó a la teoría celular. En el
XVII ya se habían visto al microscopio las células de los vegetales (Hooke y
otros) pero no es hasta el XIX que se reconoce la célula como unidad
estructural de las plantas por los botánicos alemanes. El desarrollo del
microscopio acromático (Amici) permitió al checo Purkinje constatar que los
tejidos animales (especialmente los embriones) estaban compuestos de células
densamente apretadas.
Schleiden (1804-1881) anuncia en 1838 que la célula es la unidad viva básica
de las plantas. Dos vidas: la propia y primaria y otra como parte de un
tejido. Llama la atención sobre el núcleo (descubierto por Brown años antes)
como origen de nuevas células.
Schwann (1810-1882) extiende en 1839 la teoría anterior a todos los seres
vivos. Sostuvo que los huevos fertilizados eran una sola célula. Las células
se forman por dos fuerzas: metabólica (transformando el material intercelular
en nuevas células) y atracción (concentrando el material intercelular).
Aplica esta teoría a la clasificación de Bichat, distinguiendo cinco clases
de tejido: de células independientes y separadas (como el sanguíneo),
independientes y comprimidas (piel), rígidas bien unidas (huesos y dientes),
alargadas fibrosas (tendones) y células unidas (nervios y músculos).
En la década de los 40’s se descubre que las nuevas células se forman por
fisión.
Virchow cambia el concepto de enfermedad; ésta se produce en las células. Es
como una revuelta en el cuerpo social.
HANKINS ("Ciencia e Ilustración")
Durante el siglo XVIII la fisiología y la biología logran su estatus de
ciencias, separándose de la medicina que las había amparado hasta los siglos
anteriores (igual que la química).
La historia natural. El primer paso para el estudio de los seres vivos era su
clasificación. Las clasificaciones podían hacer a partir de una o varias
características (artificiales, defendido por Tournefort) o buscar la esencia
de cada ser (naturales, defendido por Ray). Seguía dominando la idea aristotélica
de las Categorías (género y especie), esta concepción empezó a quebrarse al
descubrirse la sexualidad de los vegetales (Camerarius 1694). Linneo, que era
médico, empleó las características de fructificación para clasificar los
vegetales mediante un sistema binomial (primera palabra = género, segunda =
especie). Esta metodología se extendió con posterioridad al reino animal,
siendo en ambos casos más preciso y útil que cualquier sistema anterior. El
ataque más fuerte a esta clasificación procedió de Buffon quien creía que
dicho sistema era someter a la naturaleza a una abstracción artificiosa de la
mente humana y más bien se inclinaba por la metafísica idea de la Gran Cadena
del Ser de Leibniz (plenum). Buffon sostiene que conocemos las cosas naturales
sobre a través de su sucesión en el tiempo lo que le separa de otros
contemporáneos suyos que también creían en la Gran Cadena del Ser pero
estática, intemporal (Bonnet). Kant distinguirá entre la historia de la
naturaleza y la descripción de la misma, aunque se debe tener en cuenta que
los defensores de la historicidad (Buffon y Cuvier) no fueron evolucionistas
en absoluto. Las ideas que servirán de base a la teoría evolucionista
aparecen durante el siglo pero son independientes de los sistemas clasificatorios.
La filosofía mecánica y el estudio de la vida. El mecanicismo cartesiano
barrió la fisiología basándose en la idea de que los seres animados eran
autómatas. Fontenelle reconoce la imposibilidad de aplicar las matemáticas a
los seres vivos. Ello también fue una de las razones del éxito de la historia
natural cuyo fin era terminar con los espíritus y las almas. Su estudio se
hizo más fenomenalista.
La fisiología experimental. A partir de 1740 se asiste aun renacimiento de la
fisiología experimental con la idea de estudiar no sólo el funcionamiento de
las partes del cuerpo, sino también su crecimiento, nutrición y regeneración.
De una manera simplificadora podríamos decir que se pasa de una concepción
mecanicista a otra vitalista, aunque el vitalismo que renació en 1760 lo hizo
en un contexto netamente experimental. A pesar de que la física experimental
se adopta como modelo de investigación, no hay aplicaciones de la misma en el
campo de la fisiología (algo de electricidad - Galvany). Será la química la
que empezará a aplicarse con éxito a partir de los 70`s. Priestley en 1778
descubre que las plantas emiten oxígeno (aire desflogistizado) a la atmósfera
y Ingen-Housz, el año siguiente, dirá que sólo lo hacen en presencia de luz
(no de calor) y sólo sus partes verdes. Otros químicos esttudiaron desde este
punto de vista la digestión (Reaumur, de Graaf, Spallanzani) sin demasiado
éxito pero con algunas constataciones (ácidos gástricos, función de la
saliva, etc.). Stahl negará cualquier conexión entre química y fisiología
basándose en la existencia de un anima sensitiva en los seres vivos que los
hacen totalmente diferentes de la materia inerte. Esta concepción pasará a la
escuela de Montpellier donde se desarrollarán las teorías vitalistas a partir
de 1760 (Fouquet, Venel). La paradoja central de la fisiología será
precisamente el recurrir a un ánima distribuida por toda la materia viva
cuando querían acabar con el concepto cristiano de alma. Buffon no aceptaba
el vitalismo de Stahl pero reconocía la insuficiencia del mecanicismo.
La generación. En ningún otro campo fue tan evidente la insuficiencia de las
teorías mecanicista como en el de la generación y la embriología. Dos
descubrimientos vinieron a demostrar dicha insuficiencia: la partenogénesis
del pulgón (Bonnet) y la regeneración de la hidra de agua dulce (Trembley).
Este último experimento vino a enturbiar la polémica que venía de antes entre
epigénesis (Harvey) y preformacionismo (mecanicista). No se pudo usar el
microscopio de precisión hasta 1830, por lo que todos los debates eran
defensas de mecanismos supuestos. Linneo, y sobre todo Kolreuter investigaron
sobre los híbridos en las plantas hasta que llegaron a la conclusión de que
tales híbridos eran estériles.
El resurgimiento del preformacionismo. Von Haller observó en los huevos de
pollo que los órganos diferenciados aparecían casi simultáneamente, lo cual
era lógico ya que un riñón no puede vivir separadamente, lo que le llevo de
su epigenetismo al preformacionismo. Bonnet, Haller y Spallanzani se
sintieron atraídos por la versión ovista del preformacionismo. Y lo
defendieron de forma muy especulativa. Spallanzani, experimentando con perros
y ranas, llegó a la conclusión de que el semen masculino era el responsable
de la fecundación, pero ignoraba qué parte del mismo; por ello hizo pruebas
concluyendo erróneamente que era la parte líquida del esperma la
responsable.
5. Las ciencias de la Tierra.
SOLO EN CASA.
La perspectiva histórica en las ciencias de la tierra generará una nueva
disciplina: la geología. Hay dos posturas básicas sobre el cambio y sus
agentes: 1) catastrofismo, neptunismo (Wermer) pone el acento en los
fenómenos de precipitación y cristalización y 2) uniformismo, vulcanismo
(Hutton), pone el acento en la acción del calor interior del globo. Esta
última ganará aceptación bajo la interpretación de Lyell.
Se generalizan los estudios estratigráficos (muy necesarios por otra parte
para la minería) tanto en sus aspecto mineralógicos (química), como
paleontológicos (fósiles y condiciones climáticas del pretérito).
MASON, Vol. 4, Cap. 1 («El desarrollo de la
geología»).
La geología es un campo de estudio dividido y disperso (técnicas mineras,
estudio de fósiles, filosofía especulativa) hasta que en el siglo XVIII empieza
a cristalizar como ciencia independiente alcanzando la madurez a principios
del XIX.
Woodward (1695) establece una primera teoría sobre los fósiles basada en la
sedimentación producida después del Diluvio Universal que fue bien aceptada.
Ray replicó que las montañas se habían elevado sobre el lecho oceánico por la
acción del calor volcánico y Moro de Venecia estableció una teoría sobre la
formación de los estratos (1740) basada bajo este punto de vista. Ambas
concepciones opuestas son el inicio de la polémica entre neptunistas y
vulcanistas que estallará a finales de siglo y durará hasta 1830. Antes y
después de dicho periodo ambas teorías se consideraron como complementarias
pero durante la polémica se asoció el neptunismo al catastrofismo y el vulcanismo
al uniformismo.
Las teorías evolucionistas anteriores a la polémica no atrajeron demasiada
atención. La más conocida fue la de Buffon quien extendió el tiempo geológico
mucho más allá del bíblico comúnmente aceptado (de 6000 a 80000 años).
La experimentación en geología era muy limitada, se reducía a la recolección
de observaciones de distintas localidades. En este campo hay que destacar los
trabajos de Guettard y Desmarest quienes combinaban las teorías neptunistas y
vulcanistas, sosteniendo que el calor había tenido influencia en la formación
primitiva de las rocas, siendo luego más notable la acción del agua. Guettard
fue el iniciador de los estudios estratigráficos. Strachey, Lehmann y Fuchsel
siguiendo con dichos estudios establecieron las series verticales de estratos
como una sucesión histórica.
Werner, fundará una escuela puramente neptuniana, versión secularizada y
ampliada de la teoría de Woodward. El proceso de formación de los estratos
es, a partir de un océano primitivo, por cristalización, precipitación y
sedimentación. Con ello clasifica los minerales en cuatro clases
fundamentales pero no da cuenta de la desaparición del océano
primitivo.
Hutton, frente a Wermer, hace hincapié en la actividad geológica del calor
interno de la Tierra. Sostenía que el interior de la tierra era de lava
fundida y que escapaba a través de la corteza sólida que le servía de envase.
Bajo esta concepción no existía ni principio ni final sino que se trataba de
un proceso permanente. Sus discípulos Playfair y Hall extendieron la teoría e
hicieron algunos experimentos que la corroboraban. Su teoría no se extendió
con facilidad por considerarse atea.
En 1807 se crea la Sociedad geológica británica (con mayoría de neptunistas)
y en esa época se generalizan los estudios estratigráficos basados en los
fósiles que contenían. Dichos estudios fueron realizados por Smith en
Inglaterra y por Cuvier en Francia. Éste último, contrario a toda idea
evolucionista, era un neptunista acérrimo que buscaba fósiles de vertebrados con
el fin de completar la Gran Cadena del Ser.
A pesar de que las ideas de Werner y Cuvier fueron bien aceptadas en
Inglaterra (porque conciliaban mejor la teología con la geología) las
investigaciones en las rocas primarias (silúricas) hizo patente que éstas se
habían formado por solidificación de rocas fundidas (Sedgwick y
Murchison).
Lyell argumentará hacia atrás en el tiempo, partiendo de las fuerzas
geológicas actuales (uniformismo). Y, con el tiempo, aceptará las teorías
evolucionistas de Hutton hasta el punto de aceptar el evolucionismo
darwiniano cuando se publique El origen de las especies en 1859.
El propio Darwin confiesa en su autobiografía que el estudio de la geología
le condujo al evolucionismo, aunque el mecanismo biológico se lo sugiriese la
obra de Malthus.
HANKINS ("Ciencia e Ilustración").
El término geología es empleado por primera vez por Horace Benedict Saussure
en 1796, pero la disciplina se va concretando a lo largo del siglo XVIII. Es
Buffon con su idea de la temporalidad quien introduce una concepción de
formación histórica de la Tierra. Guetard y Desmares descubren el origen
volcánico de numerosos minerales y formaciones montañosas. Hutton, uno de los
padres de la moderna geología, creyó que las formaciones geológicas eran
debidas a la acción del calor interior de la tierra (los
vulcanistas-uniformistas) mientras que Werner (otro de los padres de la
ciencia) afirmó que las formaciones geológicas eran debidas a los efectos del
agua: sedimentación, arrastre, etc. (neptunistas-catastrofistas). Los
vulcanistas no creían en el catastrofismo, sino en una acción lenta pero
continuada, pero tanto una perspectiva como la otra requerían un tiempo
geológico muy superior al que defendían los religiosos en base a las
escrituras.
6. La ciencia en el siglo XIX.
SOLO EN CASA.
El inicio del periodo romántico (70’ y 80’s del siglo XVIII) se caracteriza
por un cambio señalado por: 1) temporalización en las ciencias del entorno,
2) nueva química de Lavoisier y 3) rigor y matematización en la física con el
apogeo del análisis matemático. El ideal romántico de búsqueda de una
interpretación unitaria encontrará indicios en muchos campos: Galvani
(electricidad y movimiento muscular), Volta (química y electricidad), Oersted
(electricidad y magnetismo), etc.
De las escuelas y universidades salen los más destacados científicos, los
sabios empiezan a desempeñar puestos politicos (Carnot, Berthollet), no se
fundan nuevas instituciones científicas, pero la industria británica hace de
acicate investigador. Alemania a pesar de su retraso alcanzará la supremacía
en la segunda mitad del siglo XIX.
MASON, Vol. 4, Cap. 3 («Las instituciones científicas en
Francia y Gran Bretaña durante el siglo XIX»).
Francia e Inglaterra son los países líderes en ciencia durante el XVIII,
inclinándose más los primeros por la interpretación teórica y los segundos
por la investigación emopírica. En el XIX desaparecerá esta distinción
metodológica, pero a finales de siglo ambos se verán superados por
Alemania.
En Francia, la revolución significó en un primer momento un acicate para la
investigación, creándose el comité de pesas y medidas y estudiando otros
problemas prácticos. Pero el terror jacobino acabó con todo (arrastrando
además a hombres valiosos como Lavoisier, Condorcet y Bailly). Después la
Convención convocó nuevamente a los científicos a puestos políticos (Monge,
Carnot, Fourcroy, Berthollet, etc) con el fin de resolver problemas de orden
técnico. Se empiezan a reformar las instituciones o se crearon de nuevas (Museo
de Historia Natural, escuelas militares y médicas, Escuela Politécnica,
Conservatorio de Artes y Oficios, etc.). La Escuela Politécnica tuvo un éxito
inmediato con Laplace, Lagrange, Monge y Berthollet como profesores y Carnot,
Gay Lussac como alumnos. Su efecto fue la concentración de la ciencia en
París empobreciendo las provincias. La restauración borbónica (1814)
significó una vuelta al anticientificismo en los círculos oficiales.
En Inglaterra hubo un notable desarrollo de las sociedades científicas y
filosóficas provinciales (Manchester, Sdad. Lunar de Birmingham, Liverpool,
Yorkshire, etc.) además de las sociedades especializadas (linneana,
geológica, química) algunas veces con los reparos de la Royal Society. A
mitad de siglo se reforman los estatutos de las universidades abriendo el
campo de la ciencia a dichas instituciones, pero parece que los Institutos de
Mecánica fueron más activos a la hora de suministrar nuevos conocimientos. A
principios de siglo se había fundado la Institución Real y Herschel y Babbage
fundarán la sociedad analítica, criticando éste último que la ciencia en
Inglaterra fuese cosa de aficionados cuando en otros países constituía una
actividad autónoma, muchas veces financiada por el estado. En 1831, bajo el
impulso de Brewster, se funda la Asociación Británica para el Avance de la
Ciencia que significará una importante herramienta de presión política así
como de difusión de conocimientos entres las demás instituciones aunque la
financiación gubernamental no se conseguirá hasta la primera gran guerra. La
Royal Society, que tanto impulso había dado a la cienci en el siglo anterior,
languideció con una mayoría de socios no científicos.
MASON, Vol. 4, Cap. 8 («Ciencia e ingeniería»).
Hasta 1850 aproximadamente, es la ciencia la que se beneficia del estudio de
los problemas de ingeniería, pero a partir de esa fecha la tendencia se
invierte: los avances tecnológicos son debidos a la ciencia.
Durante el siglo XVIII y principios del XIX los ingenieros estuvieron
interesados en la ingeniería de precisión (máquinas para hacer máquinas:
taladro, torno), la producción en masa, etc. El desarrollo de las máquinas
herramienta acelera y normaliza la producción de telares, máquinas de vapor,
etc. Aparición de un nuevo material: el acero, más resistente y menos duro
que el hierro colado (Bessemer y Siemens).
La teoría termodinámica empezará a hallar aplicaciones a fines del XIX
(Linde: refrigeradores, Beau de Rochas: ciclo de una máquina de combustión
interna; Otto, Daimler y Diesel: motores de gasolina; Laval, Parsons: turbina
de vapor). La turbina se utilizó para los generadores eléctricos que
permitieron el uso del telégrafo y otras muchas aplicaciones eléctricas:
bombilla (Edison), válvula (Fleming), etc.
MASON, Vol. 4, Cap. 9 («Las aplicaciones de la química y
la microbiología»).
La industria química se había desarrollado hasta el XVIII por el método de
prueba y error y se ceñían a los boticarios y los tintes y aprestos para la
industria textil. Las necesidades se concentraban en el ácido sulfúrico y la
sosa cáustica: a principios del XIX se empezaron a desarrollar procesos de
producción más eficientes (cámaras de plomo, solvay).
En 1817 se aísla la clorofila (Pelletier y Caventou) y el ciclo del CO2.
Liebig fabrica los primeros fertilizantes analizando la composición química
de los suelos. Pero el ciclo del nitrógeno no fue establecido hasta más tarde
cuando se descubrieron los microorganismos responsables de su fijación (ver
infra). De la mano de Bayer, Perkin y Hofmann se desrrolló la industria de
los tintes lo que dio un gran poderío químico a Alemania (Badische Soda und
Anilin Fabrik, Bayer). Estas grandes corporaciones se dedicaron a la
investigación consiguiendo procesos industriales para la fabricación de
fertilizantes, drogas, perfumes. Los explosivos los desarrolló Nobel en
Suecia. Los plásticos sintéticos (bakelita y celuloide) y fibras artificiales
se desarrollaron en varios sitios.
Pasteur fue el fundador de la microbiología: como químico trabajó en la
industria cervecera descubriendo los microorganismos que producían la
fermentación. Se generaliza el uso de la anestesia: óxido nitroso, éter y
cloroformo. Pero las muertes en postoperatorio seguían siendo significativas.
El uso del fenol a partir de 1865 como antiséptico redujo la mortandad muy
sensiblemente. A finales de siglo, Koch y Pasteur aíslan los bacilos y
producen las primeras vacunas con bacilos inactivos o poco activos.
7. La ruptura de la física
ilustrada.
SOLO EN CASA.
El punto de vista corpuscular de Newton, empieza sustituirse por una idea de
la materia continua y macroscópica para someterla a análisis con la
pretensión de sustituir los conceptos físicos por su representación
matemática (Lagrange). No obstante la ontología de partículas sometidas a fuerzas
intermoleculares será defendida por Laplace y Berthollet quienes afirman que
dichas fuerzas se desarrollan tanto entre la materia ponderable como entre la
imponderable por lo que se sigue admitiendo la existencia de fluidos
sutiles.
Fourier, con su estudio de la distribución del calor en los sólidos, Fresnel,
con su adhesión a la teoría ondulatoria de la luz de Young, y Oersted, con su
asimilación de magnetismo y electricidad, acabarán con el proyecto
laplaciano.
Los estudios del electromagnetismo de Faraday apuntan a la teoría del campo
de fuerzas y abrían el camino para sustituir el mundo mecánico por el mundo
electromagnético (que no se realizará hasta fin del XIX).
MASON, Vol. 4, Cap. 5 («La teoría ondulatoria de la
luz»).
Durante el siglo XVIII no hay avances notables en óptica. Los desarrollos de
Lagrange y Laplace habían asentado la teoría corpuscular de la luz de Newton.
Pero en 1801 Thomas Young resucita la teoría ondulatoria de Huygens. Young
era médico por lo que sus investigaciones estaban relacionadas con el sonido
y la luz y su percepción en el ser humano. Este resurgimiento provocó un alud
de nuevos experimentos (Laplace, Arago, Malus, Brewster) que culminan en el
ensayo de Fresnel. Aunque todavía se presentaban problemas no resueltos como
la densidad del éter que transmite la onda.
La discusión se centra en primera instancia en las propiedades que ha de
tener el éter y si es posible que exista una sustancia con tales propiedades
(Stokes, McCullagh, Kelvin, Cauchy, Poisson, Green).
La teoría ondulatoria quedó bien establecida a mediados de siglo gracias a
los experimentos de Fizeau y Foucault quienes midieron su velocidad en
distintos medios.
MASON, Vol. 4, Cap. 6 («El desarrollo de la electricidad
y el magnetismo»).
Franklin en el siglo XVIII había popularizado la teoría de que la
electricidad era un fluido sutil: su exceso cargaba los cuerpos positivamente
y su defecto negativamente. Pero había varias objeciones: los condensadores
no se descargaban, la electricidad parecía estar sólo en la superficie del
cuerpo. A fines de siglo se empezaba a pensar en una acción a distancia como
la de la gravedad ya que, tanto el magnetismo como la electricidad, obedecían
la ley del inverso del cuadrado.
Los filósofos de la naturaleza alemanes se interesaron más por la polaridad
(tensión dialéctica). Oersted a principios del XIX descubrió que podía darse
una fuerza rotatoria (principio del motor eléctrico) y Ampere supuso que el
magnetismo derivaba de pequeños impulsos eléctricos. Ohm trabaja en los 20’s
con circuitos eléctricos estudiándolos de forma análoga a los conductores
térmicos de Fourier estableciendo los conceptos de potencial, intensidad y
resistencia.
Las investigaciones más notables las realizó Faraday en los 30’s, aunque
rechazó el carácter corpuscular de la electricidad que le sugerían sus
experimentos. Descubrió la propiedad de la inducción (principio de la
dinamo). Como que era contrario al atomismo, creía que el éter llenaba todo
el espacio y que se componía de líneas o tubos de fuerza cuyo mapa se podía
trazar con limaduras de hierro alrededor de un imán. Estudió las
interacciones entre luz, magnetismo y electricidad sugiriendo la primera
teoría electromagnética de la luz propuesta por Maxwell en 1862. Maxwell
desarrolla una teoría corpuscular muy próxima a la de los electrones.
Kirchhoff demostró en 1857 que la electricidad estática y la corriente se
relacionaban como una velocidad, que ésta era constante e igual a la de la
luz. A finales de siglo, los modelos basados en el éter hubieron de
abandonarse. Hertz empezó a estudiar las ondas electromagnéticas y sus
propiedades (la reflexión, la refracción, etc.).
HARMAN, Cap. I («Introducción: la estructura conceptual
de la física del siglo XIX»).
A principios del siglo XIX "física" se usa en el sentido moderno y
especializado (mecánica, electricidad y óptica) y se identificó por el papel
unificador de la energía que fue un nuevo marco para la explicación mecánica
de la naturaleza.
El contexto de la teoría física. En el siglo XVIII la mecánica es explicaba
matemáticamente sin hacer consideraciones sobre átomos o fuerzas, mientras
que las demás realidades (calor, electromagnetismo, etc.) se explicaban por
fluidos sutiles aunque a final del siglo ya habían empezado a realizarse
mediciones exactas de éstas. Cuatro fenómenos van a colaborar al impulso de
la nueva física unificada: 1) La matematización de las fuerzas
intercospusculares de Laplace y su insistencia en esa unificación, 2) La
teoría matemática del calor de Fourier, 3) la teoría ondulatoria de la luz de
Fresnel y 4) la formulación de la ley de conservación de la energía.
Física de la energía y explicación mecánica. El estudio de las relaciones
entre calor y trabajo mecánico fue de capital importancia (formulación de las
leyes de la termodinámica). Los físicos del XVIII consideraban los procesos
mecánicos y no mecánicos como sistemas físicos distintos. Clausius (1850)
reconciliará la contradicción aparente entre las teorías de Joule (el calor
se consume en la generación de trabajo mecánico) y Carnot (la generación de
trabajo se debe a las diferencias de temperatura). Thomson se esfuerza en
establecer el concepto de energía como magnitud fundamental de la
física.
El éter y las teorías de campo. El concepto de campo físico en el que se
distribuyen las fuerzas eléctricas y magnéticas se consolida a partir de
1850. Maxwell desarrolla en los 60’s una teoría física del éter mecánico; su
teoría, mediante dinámica lagrangiana, le lleva a la conclusión de que la
velocidad de propagación de las ondas electromagnéticas es la misma que la de
la luz. A partir de ello desarrolla una teoría electromagnética de la luz. A
finales de siglo el concepto de campo físico se interpreta de diversas
formas: Lorentz propone una física universal fundada en conceptos
electromagnéticos (electrones).
Los problemas de la física molecular. La teoría cinética de los gases
(Clausius y Maxwell, 50’s) da un apoyo adicional a la concepción mecánica de
la naturaleza. El diablillo de Maxwell muestra que la interpretación
molecular de la 2ª ley debe basarse en métodos estadísticos. Boltzmann (1877)
establece la relación entre entropía y a análisis estadístico de los
movimientos moleculares. Pero a final de siglo Plank negará la idea de que la
entropía pueda ser explicada a partir de los principios mecánicos de la
materia en movimiento.
El status de la explicación mecánica. En el siglo XIX la ontología de
partículas en movimiento era fundamental en física. Tres formas de usar la
explicación mecánica: 1) explicar los fenómenos por la configuración de las
partículas y sus interacciones, 2) explicación mediante uso de modelos
mecánicos hipotéticos y 3) explicación mediante el modelo abstracto de la
dinámica analítica lagrangiana.
La historiografía de la física. Se distingue habitualmente entre la física
clásica (newtoniana, XVIII y XIX) y la física moderna (relatividad, cuántica,
XX) como si aquella fuera monolítica, pero la realidad es distinta. El
término newtoniano induce a error cuando se habla de la física del XIX porque
hay innovaciones que no pueden ser descritas como tales: termodinámica,
campos físicos, teoría electromagnética de la luz, entropía.
HARMAN, Cap. II («El contexto de la teoría física:
Energía, fuerza y materia»).
La física del XVIII y principios del XIX bascula entre las dos visiones de
Newton (Principia y Óptica; mecánica/matemática y experimental/especulativa
respectivamente). La mecánica estaba plenamente matematizada, mientras la
luz, la electricidad, el calor, la química se explicaban mediante fluidos
sutiles y fuerzas intercorpusculares. A finales del siglo XVIII empieza la
medición cuantitativa precisa (gracias a nuevos instrumentos) en estas
disciplinas.
La física laplaciana. Laplace (1749-1827) sostenía que la ley de fuerza
intercorpuscular de corto alcance sería para la física terrestre lo mismo que
la ley de gravitación universal en la física celeste. Su insistencia en esta
unificación y en la medición marcarán todos los estudios del siglo XIX. Esta
física cuantificada incluía los fluidos imponderables como el calórico. Su
programa era deudor de Berthollet (1748-1822) que había sugerido que la
atracción gravitacional y la corpuscular (afinidad química) podían ser la
misma propiedad. Los ideales de matematización, experimentación cuantitativa,
concepción unificada y postulación de modelos marcarán el desarrollo de la
física en el XIX, aunque sus teorías (fluidos imponderables, corpuscular de
la luz, etc. ) serán rápidamente desplazadas.
El rechazo de los fluidos imponderables en la física británica. Rumford
(1753-1814) había rechazado el calórico porque no podía explicar la
generación de calor por la fricción. Davy (1778-1829) enuncia una teoría de
la electricidad basada en la afinidad química abandonando el fluido
eléctrico. Young (1773-1829) niega que la luz sea un fluido elástico con su
teoría ondulatoria de la luz. Los tres postulan una teoría unificada del
éter.
Fresnel y el éter sólido elástico. La teoría ondulatoria de la luz de Fresnel
(1788-1827) contribuye al abandono de los fluidos imponderables. La física
podía unificarse mediante las propiedades mecánicas del éter concebido como
una forma de materia ordinaria, no como fluido imponderable. Su importancia
radica en que proporciona un paradigma para la unificación de la física bajo
la concepción mecánica.
El éter lumínico y la explicación mecánica. Cauchy (1789-1857) atribuye al
éter las propiedades de un sólido elástico que permite la propagación de
ondas transversales y justificaba la teoría de Fresnel. Los físicos británicos
introducen el estudio de la matemática analítica continental en Inglaterra lo
cual permite que Green (1793-1841) y McCullagh (1809-1847) establezcan
teorías ondulatorias de la luz basadas en la dinámica analítica de Lagrange
(1736-1813) que no está ligada a ningún modelo físico específico. Stokes
(1819-1903) propondrá un modelo alternativo mediante la analogía del un éter
similar a una mezcla de pegamento y agua.
Fourier y los métodos matemáticos de la física. Fourier (1768-1830) hizo una
contribución notable a la física unificada con su teoría analítica del calor
basada en ecuaciones diferenciales que caracterizaban su transmisión. Ekudía
toda hipótesis sobre la naturaleza del calor. Fuese lo que fuese el calor, su
propagación podía establecerse mediante las ecuaciones. La obra de Fourier
resalta la importancia del formalismo matemático independiente de las teorías
sobre la constitución de la materia.
El éter eléctrico. Oersted (1777-1851) descubre el electromagnetismo
(unificando los fenómenos eléctricos y magnéticos) lo que conduce a una
teoría de la propagación de las fuerzas eléctricas. Ello llevó al estudio de
la disposición de las -fuerzas eléctricas y magnéticas. Ampere (1775-1836)
propone una analogía con la luz y considerando el éter como medio propagador.
Faraday (1791-1867) explica el fenómeno de la inducción eléctrica mediante la
propagación de una onda eléctrica; será el antecedente de su teoría del campo
electromagnético.
Los procesos de conversión y la unidad de la naturaleza. Al abandonar
progresivamente las teorías sobre fluidos imponderables, los físicos
restablecían su consciencia de la unidad de la naturaleza. El calor, la luz y
la electricidad son vistos en un nuevo contexto: el de la dinámica del éter.
Y empieza el estudio de sus interconversiones. Faraday estudia la conversión
de la electricidad en química. Todo ello basado en que las capacidades no
pueden surgir de la nada, ni diluirse en ella. Grove (1811-1896) la expondrá
popularmente y se la interpretará posteriormente como una enunciación
del principio de conservación de la energía.
La unidad de la naturaleza: el calor y el trabajo mecánico. Los físicos del
XVIII ya habían enunciado el principio de conservación de la vis viva
(energía mecánica). A principios del XIX se establece el concepto de trabajo
físico como integral de la fuerza respecto a la distancia, con lo que se
establece una base cuantitativa para los procesos de conversión. En la década
de los 40’s se estudia el factor de conversión entre calor y el trabajo (equivalente
mecánico del calor). Joule (1818-1889) establece que dondequiera que se gaste
fuerza mecánica se obtiene siempre un equivalente exacto de calor. Esta
convertibilidad se asentaba en la concepción del calor como movimiento de las
partículas de la materia.
Helmholtz y la conservación de la energía. Helmholtz (1821-1894) ofrece una
formulación matemática del principio de conservación de la energía. Sus
estudios del calor animal y la acción muscular le llevan a suponer que podían
obtenerse de la oxidación de los alimentos. Siguiendo a Liebig (1803-1873),
quien había afirmado que la respiración era la única fuente del calor animal,
dijo que tal argumento sólo podía ser válido si se suponía un principio de
indestructibilidad y de constancia de la fuerza. Para ello definió los
conceptos de fuerza viva y fuerza de tensión (que concuerdan con los de
energía cinética y potencial)
8. La física de la energía.
SOLO EN CASA.
El desarrollo de la máquina de vapor lleva a Carnot a elaborar una teoría
general de las máquinas movidas por el calor desde la teoría del calórico. La
capacidad motriz dependía de la diferencia de temperaturas como la diferencia
de alturas genera energía hidráulica en las caídas de agua. Joule en 1840
establece cuantitativamente la equivalencia entre calor y trabajo mecánico,
entrando en contradicción con la teoría de Carnot y con quienes veían el
calor como una forma de movimiento (Rumford). Por otra parte la teoría de
Joule se enfrentaba con el problema de la disipación que solucionó
Thomson.
Helmholtz formula la primera versión del principio de conservación de la
‘fuerza’. En 1850-1 Thomson y Clausius logran reconciliar las teorías de
Carnot y Joule dando nacimiento a la termodinámica con dos principios
básicos: conservación y disipación.
La energía pasa a ser considerada el concepto primario en física. Se busca
reemplazar la mecánica en física y el atomismo en química.
MASON, Vol. 4, Cap. 7 («La termodinámica, ciencia de los
cambios de energía»).
El uso generalizado de la máquina de vapor obligó al estudio de las diversas
formas de energía (calor, luz, electricidad, etc.). Rumford observa al
perforar cañónes que el calor producido y el número de barrenas gastas eran
inversamente proporcionales; ello socababa la teoría del calórico y concebía
el calor como una forma de movimiento mecánico. Esta concepción fue defendida
por Davy y Young aunque no se impuso hasta mediados de siglo XIX.
Fourier estudia la conducción térmica y tiende a considerar los fenómenos
térmicos distintos de la mecánica. Carnot analiza la producción de energía
mecánica a partir de calor en la máquina de Watt con un analogía con la
máquina hidráulica (altura de caída = diferencia de temperatura, cantidad de
fluido = cantidad de calórico). Más adelante abandonaría la idea del
calóricoy aceptaría que el calor no es más que el movimiento de las
partículas de los cuerpos.
Liebig (siguiendo a Lavoisier) supone que la energía mecánica de los animales
deriva de la energía química de sus alimentos. Mayer y Helmholtz siguieron
esta línea de pensamiento pero el vitalismo imperante en la Alemania de la
época hizo que no fructificase la teoría.
Joule hizo el trabajo experimental que llevó al principio de conservación de
la energía: efectos térmicos de la corriente eléctrica (resistencia
intensidad). Serán Clausius y Kelvin quienes lo establecerán en 1851 (primer
principio de la termodinámica: la energía del mundo es constante). Clausius
también establecerá el segundo principio: la entropía del mundo tiende a un
máximo (principio de disipación de la energía) a partir de la consideración
del calor de un gas como la energía cinética de las moléculas que lo
componen. Maxwell afirmará que no todas las moléculas tienen la misma carga
de energía (el diablillo de Maxwell podría separar las moléculas más
aceleradas de las menos obteniendo así una diferencia de temperatura sin
gasto de energía). Boltzmann demostrará que la distribución de la energía
será aleatoria, confirmando con ello el principio de entropía: la energía
mecánica, se transforma en calor y éste se dispersa (al contrario de lo
afirmado por Newton).
Durante el siglo XIX se estudia la tasa de dispersión de la energía en
procesos tales como el enfriamiento solar (Kelvin, Pouillet, Herschel, Mayer,
Waterson, Helmholtz) para establecer su tiempo de existencia (20-30 millones
de años). Al aplicar dichos procedimiento s la Tierra se obtiene un periodo
de 20-40 millones de años, abiertamente contrario a lo establecido por la
geología que precisaba de más de 200 millones para explicar la formación de
las rocas sedimentarias. La reconciliación de ambos cálculos se logró al
descubrir el fenómeno de la radioactividad (Becquerel, 1896) y el desarrollo
de otras teorías sobre la energía solar. La tasa de desintegración del uranio
en plomo permitió establecer la antigüedad de los estratos rocosos,
llegándose a estmaciones de 2000 años.
La termodinámica influyó poderosamente en el campo de la filosofía de la
ciencia: abandono de las hipótesis sobre la naturaleza de la materia y de la
energía. La naturaleza es una sucesión de fenómenos y la ciencia es una
actividad que los correlaciona. Mach: la tarea de la ciencia es subsumir
hechos bajo relaciones generales. A pesar de su atractivo, los teóricos
atomistas se opusieron a esta perspectiva, cuando la teoría atómica de la
materia estaba efectuando notables avances (electrones, número de Avogadro,
etc.). Ello derivará en el siglo XX en el abandono de los modelos teóricos
mecánicos que serán sustituidos por los matemáticos (Heisenberg y la
descripción del átomo, 1945).
HARMAN, Cap. 3 («Física de la energía y explicación
mecánica»).
Carnot y la capacidad motriz del calor. Carnot (1796-1832), partidario de la
teoría del calórico, consideraba que el papel del vapor en la máquina de Watt
consistía en transportar el calórico entre la cámara de vapor y el
condensador donde se recuperaba. El factor crucial de la producción de
trabajo era la diferencia de temperatura por el flujo de calórico. Así como
la cantidad de agua se conserva en una máquina hidráulica, la cantidad de
calórico también en una máquina de vapor. Describe el ciclo de operaciones de
una máquina ideal que será popularizada por Clapeyron. Procesos isotérmico y
adiabático.
Thomson y los problemas de la termodinámica. Thomson, lord Kelvin (1824-1907)
intenta reconcialiar la teoría de la conservación del calórico de Carnot, con
la afirmación de Joule de que el calor se consumía al generar trabajo
mecánico. Kelvin observa que la teoría de Carnot tiene como base el calórico
(el fluido imponderable) lo cual no le parece demasiado aceptable. La teoría
de Joule presentaba la dificultad de no poder explicar los procesos
irreversibles como la conducción del calor. Kelvin no llegó a establecer
teoría alguna pero al contraponer ambas ideas abrió el campo.
Clausius y las leyes de la termodinámica. Clausius (1822-1888) desliga la
teoría de Carnot del calórico y encuentra que ambas son compatibles y enuncia
dos principios fundamentales: 1) equivalencia de calor y trabajo y 2) la generación
de trabajo por el calor en los procesos cíclicos (una parte del calor se
convierte en trabajo y hace descender la temperatura del fluido). Clausius
añade (tal como había hecho Joule) que el calor consiste en movimiento de las
partículas de la materia. El calor era por tanto la medida de las fuerzas
vivas (energía cinética) de las partículas en movimiento.
Thomson: la conservación y la disipación de la energía. Para Kelvin, el
asunto clave era la irreversibilidad, aceptando los principios de Clausius.
El calor se disipa como lo demuestra el fenómeno de la conducción del calor.
Para Kelvin las dos leyes de Clausius expresaban la indestructibilidad y la
disipación de la energía. Se apoya en argumentos teológicos.
La aparición de la física de la energía. A mediados de siglo el concepto de
energía se convierte en el concepto primario de la física y se usaba de forma
generalizada para explicar todos los fenómenos. Tenía muchas ventajas:
inmutabilidad, convertibilidad, papel unificador. Kelvin sugiere que se puede
dividir la energía en dos clases: estática y dinámica (hoy: potencial y
cinética). Rankine (1820-1872) realza el valor del concepto en una física
sistemática, axiomática y no hipotética.
Conversión y conservación: los conceptos de fuerza y energía. El uso del
concepto energía, destaca la ambigüedad de la noción de indestructibilidad o
conservación de la fuerza (vis viva) y del propio término. Rankine, en una
respuesta a Faraday, dice que mientras la fuerza puede ser considerada como
la tendencia de un cuerpo a cambiar de lugar, la energía puede considerarse
como una cantidad conservada medida como el producto de la fuerza y la
distancia. Controversia entre Tyndall y Tait sobre las contribuciones de
Mayer.
Irreversibilidad: Clausius y la entropía. En su primera formulación de la
leyes de la termodinámica, Clausius enunciaba la segunda ley como una
dirección del flujo sin preocuparse de sus implicaciones. En obras
posteriores estudia el valor de equivalencia de las transformaciones térmicas
y al aplicarlo a los procesos irreversibles acuña el término entropía para
referirse a este valor de equivalencia. Mientras la primera ley expresaba la
conservación de la energía en el universo, la segunda expresaba el incremento
de la entropía del universo. La irreversibilidad era un rasgo fundamental de
la naturaleza. Intento explicar dicho rasgo por la ordenación y movimientos
de las moléculas de los cuerpos. Maxwell criticará este intento porque
introducía hipótesis adicionales sobre la constitución de la materia que no
venían a cuento, defendiendo que la segunda ley era eminentemente estadística
y que no podía ser explicada por movimiento moleculares individuales
(diablillo).
Irreversibilidad y cosmogenia. Kelvin veía la segunda ley como un principio
que implicaba el enfriamiento progresivo de la tierra y por ello se haría
inhabitable. Se empieza a hablar de la muerte térmica del universo
(Clausius), de la frontera del éter (Rankine, Helmholtz). Kelvin lo explicaba
en función de la teología natural.
Física de la energía y explicación dinámica. Los tratados de los años 60’s
reconstruyen la dinámica analítica integrando las ecuaciones de Lagrange con
la ley de la conservación de la energía mediante las que podían derivar la
totalidad de las condiciones de equilibrio y movimiento de un sistema. Con
ello quedó plenamente creditado que la energía y la materia eran los
constituyentes fundamentales de la naturaleza. Maxwell reconoció la
universalidad del método al aplicarlo a un sistema electromagnético.
HARMAN, Cap. 5 (Teoría de la materia: los problemas de la
física molecular»).
La constitución física de la materia era incierta en el XIX. La ontología de
partículas era fundamental pero era sólo un presupuesto.
El atomismo químico. Para Newton los átomos eran todos iguales y al
combinarse de diferentes formas creaban las diferentes sustancias. Los
elementos químicos eran agregaciones de átomos que tenían ciertas afinidades.
Lavoisier no consideraba los átomos pertinentes en el estudio de la química,
los elementos químicos eran l resultado final del análisis químico. Dalton
(1766-1844) proporcionó la base teórica de la química congruente con la
definición de elemento químico de Lavoisier suponiendo átomos desiguales para
cada elemento químico buscando en el peso relativo de los mismos su
posibilidad combinatoria. Proporciones fijas y razones simples. Afirmaba la
realidad física de los diferentes átomos químicos negando la teoría de la
estructura de Newton. Distinción entre atomismo físico (Newton) y químico
(Dalton). En los primeros años del siglo se realizaron varias tablas de pesos
relativos (Berzelius, Davy, Wollaston) con sistemas estequiométricos. Las
combinaciones químicas de átomos estaban bien establecidas hasta que se
descubrió la isomería (Berzelius) que suponía la posibilidad de combinación
de átomos en distintas estructuras. En 1860 se Cannizaro revive la hipótesis
del número de Avogadro para el cálculo de los pesos moleculares. Aunque la
naturaleza del átomo seguía siendo pura especulación, la teoría molecular de
la materia y la teoría atómica química estaban firmemente establecidas.
Física molecular: la teoría cinética de los gases. Newton tenía una
concepción estática de los gases: sus partículas se mantenían quietas por la
fuerza intercorpuscular repulsiva. Dicha teoría se mantiene hasta que
Clausius expone una teorúa cinética basada en las fuerzas intermoleculares
(atractivas a grandes distancias y repulsivas en la cercanía) con argumentos
probabilísticos. Maxwell aporta soficticación matemática a la teoría con el
análisis estadístico basado en la curva normal de Laplace (sólo es posible el
análisis del comportamiento de grandes agregados de moléculas).
Los problemas de la estructura molecular. Para Maxwell la teoría cinética de
los gases proporcionaba una base para la formulación de modelos sobre la
estructura de la materia. Pero entre el análisis espectrocópico y la teoría
de los gases (teorema de equipartición: distribución homogénea de la energía
en toda la masa del gas) había incongruencias. Rayleigh (1842-191) estudia el
argón (gas monoatómico). Prout (1785-1850) había sugerido que el hidrógeno
era la ‘materia prima’ de todos los demás elementos cuyos pesos moleculares
eran múltiplos enteros de aquél. Loa análisis espectrales (aparato de Kirchhoff)
se usaron tanto en el análisis de los cuerpos celestes como de la materia; se
sabá que cada elemento tenía una imagen espectográfica distinta. Kelvin
propone abandonar el teorema de equipartición y Boltzmann defiende que es una
parte esencial de la teoría cinética de los gases.
La física molecular y la termodinámica. El diablillo permite violar la
segunda ley de la termodinámica porque ésta es fundamentalmente estadística.
Ello implica el abandono del método mecánico estricto. Boltzman acaba
defendiendo la teoría estadística y afirma que el aumento de entropía se debe
a la tendencia de los sistemas a alcanzar su distribución molecular más
probable.
La termodinámica química y la enegética. A fines de siglo Planck (1858-1947)
cuestiona la explicación de conceptos termodinámicos mediante teoría
estadística basándose en los desarrollos de la termodinámica en la química.
Con ellos aparece una nueva disciplina (la química física) alrededor de
1880.
9. La teoría atómica en química.
SOLO EN CASA
La raíz de la teoría atómica de Dalton se puede encontrar en la química
newtoniana pero con un supuesto de partida distinto: la proposición de un
átomo distinto para cada elemento. En Dalton la teoría de los elementos de
Lavoisier es desgranada en sus partes elementales, en sus unidades mínimas de
combinación. Esta teoría sufrió largas décadas de postergación a pesar de que
explicaba las leyes cuantitativas de las reacciones químicas de Richter y
Proust. Pero no podía dar cuenta de las relaciones volumétricas de Gay-Lussac,
cuya principal consecuencia (Avogadro) permaneció largos años en el olvido.
Davy. Ligó los fenómenos de electrólisis con la reactividad química y
Berzelius creó una teoría eléctrica de la química estableciendo una teoría
polar de la reacción química con elementos positivos y negativos. Los
químicos trabajarán hasta 1860 con los pesos equivalentes de los elementos
(en lugar de los pesos atómicos de Dalton).
A partir de 1830 se desarrollará la química orgánica. El primer hito de
importancia fue la síntesis de la urea a partir de compuestos inorgánicos.
Wohler y von Liebig descubrirán la isomería y con ello dan con el gran
problema de la organización de los compuestos.
A partir de mediados de siglo se empezará la revisión de los pesos atómicos,
la idea de valencia y la teoría estructural de las moléculas orgánicas.
MASON, Vol. 4, Cap. 4 («La química y la teoría atómica de
la materia»).
Lavoisier ya había introducido los principios básicos de la química
(conservación de la materia, cuantitativismo, nomenclatura, elemento químico)
que conducen a las primeras leyes empíricas de la ciencia: ley de
proporciones equivalentes (Richter), ley de las composiciones constantes
(Proust), reacciones reversibles (Berthollet), distinción entre mezcla física
y compuesto químico (Proust).
La vieja teoría atómica (democritea) fue modificada por Dalton quien, al
observar la atmósfera, llegóa a la conclusión de que los átomos de los
distintos elementos que la componen se repelen entre sí, pero no con los de
los demás elementos. Con ello formuló la ley de las presiones parciales (cada
gas es un vacío para los demás gases) y la ley de las proporciones múltiples
y elaborando la primera tabla de pesos relativos al hidrógeno.
Gay Lussac había descubierto una ley similar sobre los gases que se unen, los
volúmenes manitenen una relación numérica simple entre sí. Aceptando con ello
la idea atómica de Dalton. Avogadro fue aún más lejos: sugiriendo que los
mismos volúmenes de dos gases contienen el mismo número de partículas (en las
mismas condiciones de presión y temperatura). La hipótesis de Avogadro, que
hubiera podido establecer un método general, no se aceptó hasta los 60’s ya
que exigía que los átomos de los gases se combinasen entre sí para formar
moléculas, cosa que entonces era impensable (el propio Dalton afirmaba que
los átomos de la misma especie se repelían). La pervivencia de la vieja
teoría atómica que afirmaba que todos los átomos eran iguales dio lugar a
combinaciones teóricas diversas. Prout y Thomson afirmaron que los átomos de
las diversas materias eran combinaciones discretas de átomos de hidrógeno
(todos los pesos atómicos se acercaban a múltiplos enteros del átomo de
hidrógeno). Pero los estudios de Berzelius y Stas mostraron que los pesos
atómicos no eran múltiplos exactos. Pero la teoría atómica no desempeñó un
papel fundamental hasta 1860.
Durante el XVIII habían despertado interés algunos fenómenos eléctricos (las
patas de rana de Galvani, la pila bimetálica de Volta). Ahora se empezará a
pensar que la electricidad puede inducir determinadas reacciones químicas:
hidrólisis del agua (Nicholson y Carlisle, 1800), de soluciones salinas,
álcalis, etc. Estos experimentos llevaron a Davy a la conclusión que la
atracción química de los elementos era esencialmente eléctrica. Berzelius
desarrollará la idea con el hallazgo de la bipolaridad, clasificando los
elementos según su carácter positivo o negativo. La afinidad química
newtoniana se explicaba así.
El análisis químico, que había avanzado notablemente también gracias a la
geología que precisaba analizar los minerales que encontraba, chocó con la
químico orgánica: los compuestos orgánicos se consideraron complejas
disposiciones de pocos elementos (hidrógeno, oxígeno, nitrógeno y carbono
sobre todo). Existían además isómeros (productos con la misma composición per
muy distintas características). Serán los químicos alemanes (Wohler y von
Liebig) quienes realizarán los primeros descubrimientos: la síntesis de la
urea, la combinación de elementos electropositivos con otros
electropositivos, la sustitución del hidrógeno (positivo) por el cloro
(negativo), etc. Dumas sugiere que las propiedades químicas de los compuestos
orgánicos son debidas a su peculiar estructura y no al carácter eléctrico de
sus elementos componentes. Gerhardt y Laurent desarrollarán la idea y el
problema de estimar los números de combinación de los átomos (que se había
abandonado) volverá al primer plano. Frankland, al investigar las
combinaciones de los metales con los radicales orgánicos, establecerá el
concepto de atomicidad (hoy, valencia). Y Kekule dirá que los átomos de
carbono pueden combinarse cuatro radicales. En el congreso de Karlsruhe
(1860) Cannizaro recordará la teoría de Avogadro (de medio siglo antes) y
mediante ésta se establecerán las valencias de cada elemento con influencia
tanto en la química orgánica como en la inorgánica. Dos descubrimientos se
sucederán casi de inmediato: la estructura del benceno (el hexágono de
Kekule) y la dirección de las valencias del carbono (el tetraedro de Le Bel y
van’t Hoff).
La teoría de las valencias animó a los químicos a establecer una
clasificación de los elementos por sus pesos atómicos que se había abandonado
en los años 30’s. Meyer y, sobretodo, Mendeleiev establecieron la Tabla
Periódica de los elementos que usamos hoy, prediciendo los elementos que
debían ocupar sus huecos y que fueron descubiertos en breve. Los 23 elementos
de Lavoisier se convirtieron en 92 en la tabla de Moseley de 1914.
El descubrimiento de la radiactividad por Becquerel en 1896 y el aislamiento
del radio por Curie en 1900 hará que la química teórica se confunda con la
física atómica en el siglo XX.
BENSAUDE-VINCENT y STENGERS, Parte III («Una ciencia de
profesores»).
Lavoisier ya había estudiado algunos compuestos orgánicos (alcohol, aceites,
etc.) y analizado la reacción de fermentación, pero la química orgánica (del
carbono) no alcanzará su estatus hasta mediados del XIX. Ello significará una
reorganización total del mundo de la química puest que se empezará a pensar
no sólo en las proporciones sino en las estructuras de las moléculas.
Esta redefinición procederá más de las cristalografía que de las ciencias de
la vida. Los cristalógrafos (como Hauy) consideraban la molécula desde una
doble perspectiva: composición y estructura. Será Laurent quien señalará en
1836 que la sustitución de un hidrógeno por un halógeno, no modifica
sustancialmente las propiedades del compuesto, atacando con ello el dualismo
electroquímico de Berzelius y poniendo el énfasis en la estructura de la
combinación (su disposición espacial). Es a partir de este hallazgo que el
interés científico pasa del átomo a la molécula. Con la humillante oposición
de Berzelius con cuya muerte (1848) morirá también la teoría dualista.
Será Gerhardt quien con su Tratado de Química Orgánica (1850) establece el
punto de partida de la disciplina. En ella adopta el concepto de ‘tipo’
químico y establece los tres radicales básicos para las reacciones de
sustitución (agua, amoníaco e hidrógeno).
Kekule toma la iniciativa de reformar la nomenclatura de Lavoisier y reúne el
congreso de Karlsruhe para lo que se deben definir primeramente los conceptos
de átomo, molécula y equivalente. Cannizaro, recordando a Avogadro, defenderá
la postura de Gerhardt que finalmente se impondrá: la definición de átomo
(masa mínima capaz de existir en una combinación) y de molécula (mínima
cantidad de materia capaz de existir en estado libre) quedan fijadas
definitivamente.
Las argumentaciones de Cannizaro influyen notablemente en la elaboración de
tablas clasificatorias de elementos, siendo las más notables la de Meyer de
1862 y la de Mendeleiev de 1869 (todavía en uso hoy en día). Esta última
establece la distinción conceptual entre cuerpo simple y elemento
consiguiendo con ello el mayor grado de abstracción. Al construir la tabla
periódica, modifica pesos atómicos de elementos (uranio e indio), corrige la
situación de otros (yodo y telurio) y descubre saltos prediciendo las
características de los elementos que se descubrirán con posterioridad. En su
lucha por la individualidad y pluralidad de los elementos se enfrentará a
Berthelot quien los considera un regreso a las fantasías alquimistas.
A partir de 1860 la síntesis química se convierte en el principal programa de
investigación de la mano de la industria que demanda nuevos productos
químicos. Aparece en seguida la gran pregunta: ¿puede la química fabricar la
vida? Wholer había sintetizado en 1828 la urea, lo cual fue el primer ataque
a la fuerza vital. Pero Berzelius señalaba que dicha síntesis era parcial (es
decir a partir de compuestos orgánicos) y no total (a partir de elementos
como había señalado Berthelot). Liebig en 1840 empieza un ambicioso programa
de producción industrial de compuestos orgánicos aunque declara explícitamente
que la química no podrá nunca fabricar un ojo humano.
Berzelius habla en 1832 de isómeros y polímeros. Pasteur descubre en 1848 las
propiedades levógiras o dextrógiras de la misma sustancia. En 1852 Frankland,
trabajando con compuestos orgánico metálicos, establece el concepto de
valencia: los metales sólo pueden combinarse con un determinado número átomos
de otros elementos. Wurtz señala que esta característica es aplicable también
a los radicales y constata que las ideas de ‘atomicidad’ de Kekule,
‘basicidad’ de Williamson y ‘valencia’ de Frankland son la misma cosa. Se
empieza a adoptar la formulación desarrollada (señalando las valencias).
Kekule descubre la posibilidad del carbono de intercambiar valencias consigo
mismo y queda establecida la hipótesis de las moléculas diatómicas de los
gases. Esta combinación de un elemento consigo mismo hubiese repugnado a
Berzelius, sin embargo no hacía sino reproducir la tesis de Avogadro. Couper
insiste en descubrir por qué determinados elementos no tienen siempre la
misma valencia, pero habrá que esperar al siglo XX para obtener la respuesta
a dicha pregunta.
Berthelot fue el fundador de la química sintética, como Lavoisier lo había
sido de la analítica. Su programa es muy ambicioso y en la cima coloca la
síntesis del benceno que no conseguirá. Será Kekule quien en 1865 propondrá
el famoso hexágono. Los discípulos de Kekule proseguirán los trabajos,
descubriendo los isómeros ‘orto’, ‘para’ y ‘meta’ de los derivados
bencénicos, la tridimensionalidad de las cuatro valencias del carbono
(tetraedro).
El realismo atómico ganará terreno a finales del XIX (Kekule usaba los átomos
pero no creía en ellos, los consideraba ficciones útiles). Duhem, van’t Hoff
y le Chatelier trabajarán sobre la noción de equilibrio y las condiciones de
endotermia y exotermia de las reacciones químicas a finales de siglo. El
concepto de colisión se vuelve central y acentúa la concepción del realismo
atómico, acercando la física a la química: ambas se hallan en una encrucijada
al iniciarse el siglo XX.
10. El mundo electromagnético y la
relatividad restringida.
SOLO EN CASA
Los principios de la termodinámica (de validez universal) dan pie a todo tipo
de especulaciones (fuerza viva de Clausius, atmósferas elásticas de las
partículas de Rankine, etc.). Clausius y Maxwell reintroducen las
interpretaciones en términos de partículas y movimientos de las mismas.
Boltzmann en los 70’s relaciona entropía y configuración molecular de un
sistema.
En el dominio electromagnético cabe distinguir dos grandes líneas: en el
continente (partiendo de Ampere) se busca una teoría unificada suponiendo la
existencia de partículas cargadas que interactúan a distancia; en GB
(partiendo de Faraday) se busca a partir de las teorías de campo lo que implica
la necesidad del éter.
HARMAN, Cap. 4 («Materia y fuerza: el éter y las teorías
de campo»).
El término 'campo magnético' fue introducido por Faraday en 1845, y luego lo
adoptaron Kelvin y Maxwell. Maxwell dio la primera definición clara del
término 'campo':
La teoría que propongo puede, por lo tanto, ser llamada una teoría del campo
electromagnético, porque trata del espacio en la proximidad de los cuerpos
eléctricos o magnéticos.
El concepto de campo iba a ser contrapuesto al de teoría de acción a
distancia de la acción electromagnética. Es decir, la transmisión de las
fuerzas por medio de los elementos contiguos del campo existentes en el
espacio entre cuerpos electrizados separados, iba a ser distinguida de la
acción de fuerzas que operan directamente entre los cuerpos electrizados a
través de distancias finitas de espacio. Esta definición no dejaba claro el
status físico del campo. En una teoría de campo, el vehículo de las fuerzas
entre los cuerpos era alguna propiedad del espacio ambiente. El campo podía
ser caracterizado como un campo de fuerza y representado a partir de la
distribución espacial de fuerzas; o, alternativamente, la propiedad del campo
de ser vehículo de fuerzas podía concebirse mediante un éter interpuesto,
contemplados ambos bien como un continuo, bien como constituidos por
partículas discretas. En un campo representado por un éter hecho de
partículas, las partículas de éter actuaban sólo sobre las partículas
vecinas; las fuerzas eran ejercida sólo entre las partículas contiguas del
éter.
Un rasgo importante del campo era el formalismo matemático adoptado para su
representación. Maxwell argüía que el lenguaje matemático de las ecuaciones
diferenciales en derivadas parciales eras expresión de la estructura física
del campo. La estructura física del campo no estaba definida unívocamente:
podía ser representada como una plenitud de fuerza, un continuo de fluido o
un éter corpuscular.
El descubrimiento por Faraday de la inducción electromagnética en 1831
suscitó la cuestión de cuál era el modo de propagación de las fuerzas
electromagnéticas, es decir, de la relación que guardaban con la sustancia
material a través de la cual se propagaban - el anillo de hierro a cuyo
alrededor se enrollaban los alambres de los circuitos eléctricos primario y
secundario -. Faraday interpretaba que la transmisión tenía lugar porque las
partículas del anillo de hierro eran llevadas a un estado de tensión
eléctrica.
En sus trabajos sobre electroquímica e inducción electrostática, Faraday
desarrolló su concepto del estado electro-tónico; lo describía como una
polarización de las moléculas de materia; por polarización entendía una
disposición de fuerzas tal que una molécula adquiría la capacidad de ejercer
fuerzas eléctricas opuestas en partes diferentes. Al demostrar que la
inducción electrostática tenía lugar a lo largo de líneas curvas, sostenía
que el vehículo de la inducción electrostática, era la transmisión de fuerza
entre las partículas de un medio "dieléctrico" que rodeaba los
cuerpos electrizados. Faraday mostró experimentalmente que sustancias
diferentes tenían una capacidad de transmitir las fuerzas electrostáticas
diferente. Sostenía que las partículas del dieléctrico que transmitían la
acción eléctrica estaban sujetas a un estado de tensión eléctrica que llevaba
a la propagación de fuerzas electrostáticas y hacía hincapié en la
distribución espacial de las fuerzas eléctricas. Aunque el concepto de
Faraday de la transmisión de fuerza entre partículas polarizadas contiguas no
ofrecía ninguna explicación del mecanismo por el que las fuerzas se
propagaban, contemplaba las fuerzas eléctricas como fuerzas que se
manifestaban en los espacios que rodeaban las partículas de la materia
electrizada.
Al intentar cubrir la laguna que presentaba su teoría, Faraday se vio llevado
a considerar las cuestiones fundamentales sobre la naturaleza de la materia.
Su Speculation touching electric conduction and the nature of matter (1844)
formulaba una teoría de la materia y de los agentes de la fuerza con la que
pretendía ofrecer una representación de la transmisión de la fuerza en el
espacio; al hacerlo, Faraday abandonaba la teoría atómica de la materia y
transformaba su teoría de la propagación de las fuerzas. En este trabajo
Faraday señalaba que, de acuerdo con la teoría atómica, se consideraba que
los átomos no estaban en contacto, y que, si se negaba la acción entre
partículas contiguas, entonces se hacía necesario adscribir un papel a los
espacios entre los átomos para dar cuenta de la comunicación de fuerzas entre
las partículas. En su concepción, el espacio no podía tener propiedades
causales análogas a las de una sustancia material ("el mero espacio no
puede actuar como la materia actúa"), y en consecuencia llegaba a la
conclusión de que la teoría de los átomos y el vacío debía ser abandonada.
Sostenía que todo conocimiento de la materia se limitaba a ideas del sistema
de "fuerzas o capacidades [powers]" asociado con las sustancias
materiales, y afirmaba que no se debía considerar que la materia estaba
constituida por átomos extensos e impenetrables rodeados por fuerzas de
atracción o repulsión; al contrario, la materia debía ser contemplada como
una plenitud de "capacidades" que llena el espacio: "La
sustancia consiste en capacidades". Esta teoría negaba la impenetrabilidad
e indivisibilidad de los átomos. En virtud de sus "capacidades", la
materia se extendía continuamente por el espacio, y las interacciones entre
las "partículas" de materia se contemplaban como interacciones
entre "centros de fuerza" extendidos por el espacio.
En su trabajo de 1846 Thoughts on ray-vibrations Faraday afirmaba que su
teoría de la materia, entendida como una disposición de fuerzas, le había
llevado a considerar que la propagación de las fuerzas podía representarse
mediante vibraciones en las líneas de fuerza. La materia se difundía por el
espacio y mostraba por lo tanto la disposición de las sustancias materiales
en el espacio: "En efecto, se supone que la partícula existe sólo por
esas fuerzas, y donde las hay, está." Anteriormente Faraday había
empleado el concepto de líneas de fuerza tan sólo para representar el
alineamiento de las partículas polarizadas, pero su nueva teoría de la
materia implicaba que las líneas de fuerza representaban la estructura de las
sustancias materiales y su interacción. Esto le condujo a abandonar la teoría
de la polarización de las partículas. Su nuevo marco conceptual fue resumido
en un artículo de 1852 titulado The physical character of the lines of
magnetic force. Allí sostenía que las líneas de fuerza eran las entidades
primarias que representaban la realidad física, y no meros símbolos que
expresasen el alineamiento de las partículas polarizadas.
Faraday había introducido dos representaciones distintas del campo, en una de
las cuales las partículas contiguas de un medio ambiente servían de vehículo
de la acción, y en la otra se afirmaba la primacía de las líneas de fuerza.
Ninguna de estas teorías ofrecía una explicación de los mecanismos por los
que las fuerzas se propagaban, si bien Faraday sugería que la transmisión de
la fuerza "podía ser una función del éter". En respuesta a las
teorías de campo de Faraday, Kelvin y Maxwell intentaron desarrollar teorías
físicas de la propagación de las fuerzas por medio de teorías mecánicas del
éter
Los primeros trabajos de Kelvin sobre la teoría de la electricidad en la
década de 1840 habían sido una exploración de la analogía matemática que se
daba entre los fenómenos térmicos y eléctricos, en la que se recurría a la
teoría del calor de Fourier para desarrollar un análisis matemático del flujo
de fuerza eléctrica a partir de una fuente análoga a la del flujo de calor.
Kelvin percibió que la analogía matemática de los fenómenos térmicos y
electrostáticos sugería paralelamente una analogía física. El modelo físico
de la propagación del calor de partícula a partícula sugería una propagación
análoga de las fuerzas eléctricas "por la acción de las partículas
contiguas de algún medio interpuesto", tal y como ocurría en la teoría
de Faraday de la propagación de las fuerzas electrostáticas por las
partículas contiguas del medio dieléctrico. Estas observaciones atrajeron la
atención hacia la correspondencia existente entre las representaciones
matemática y física, una laguna fundamental de la teoría analítica del calor
de Fourier empleada por Kelvin para explorar la estructura matemática y
física de la teoría de la electricidad.
Kelvin intentó hacer frente a esta dificultad en su artículo de 1847
Mechanical representation of electric, magnetic, and galvanic forces, donde
consideraba la propagación de las fuerzas eléctricas y magnéticas a partir de
la tensión rotacional y lineal de un sólido elástico, empleando los métodos
matemáticos que Stokes había desarrollado para el tratamiento de las
rotaciones y tensiones en medios continuos. Kelvin se dedicó entonces a la
representación matemática de la teoría de Faraday del campo magnético
entendido como una estructura de líneas de fuerza. Desarrolló este concepto
de campo magnético en un artículo llamado A mathematical theory of magnetism.
Representaba el campo magnético como una distribución continua en el espacio
de una "imaginaria materia magnética". No concebía la "materia
magnética" como una sustancia magnética, sino que se la contemplaba como
una realización concreta de la teoría de Faraday de la primacía de las líneas
de fuerza, una plenitud que representaba la distribución espacial del campo
de fuerza, que permitía la expresión matemática de las líneas de fuerza en el
espacio. Kelvin era consciente y hacía hincapié en la laguna existente entre
las representaciones matemática y física. Su teoría de la tensión de un
sólido elástico y su representación de las líneas de fuerza magnética
mediante una plenitud magnética no se proponían como un modelo de la
constitución física del campo, sino que se suponía que ofrecían meras
ilustraciones físicas o analogías de las teorías matemáticas de campo.
Kelvin publicó en 1856 un importante artículo que ejercería una gran
influencia en las teorías de campo subsiguientes. Recurriendo al concepto de
movimiento molecular que había adoptado en su teoría "dinámica" del
calor y a la teoría del calor de Rankine, según la cual el calor era un
movimiento de vórtice de las atmósferas etéreas que rodeaban los núcleos
moleculares, Kelvin argumentaba que la rotación magneto-óptica descubierta
por Faraday (el efecto rotacional del magnetismo sobre la luz polarizada)
podía ser explicada como un movimiento de vórtice en el éter:
La explicación de todos los fenómenos de atracción o repulsión electromagnética
y de inducción electromagnética, ha de ser buscada simplemente en la inercia
y presión de la materia, en cuyos movimientos consiste el calor.
La teoría dinámica del calor ofreció el modelo de una teoría física de campo.
Kelvin, sin embargo, no adoptó el concepto de "vórtices
moleculares" originalmente formulado por Rankine. Dejó deliberadamente
abierta la cuestión de cuál era la estructura física del éter cuyos
movimientos constituían el campo. Sin embargo, a finales de la década de 1850
era partidario de la teoría de que el éter había de ser considerado un
fluido. Según la teoría de "plenitud etérea", que estaba entonces
considerando, la estructura molecular y la solidez e impenetrabilidad de los
cuerpos eran el resultado de un movimiento de vórtice en un continuo etéreo
perfectamente elástico. Se daba cuenta sin embargo de que los vórtices en una
plenitud no parecían poseer la propiedad de indestructibilidad, fundamental
para cualquier teoría de los constituyentes primarios de la materia.
El su artículo de 1867 On vortex atoms ofrecía la solución de estas
especulaciones. Helmholtz había publicado un trabajo en el que mostraba que
los filamentos de vórtices en un fluido perfecto eran inmunes a la
destrucción o a la disipación, y satisfacían, por lo tanto, el criterio de
inmutabilidad de los átomos primordiales. Kelvin declaró que "los
anillos de Helmholtz son los únicos átomos verdaderos", y en su teoría
de los átomos de vórtice postulaba una plenitud que llenaba el espacio,
siendo la acción transmitida a lo largo de los filamentos de vórtices. La
teoría de una plenitud universal, que consideraba los átomos como
discontinuidades en el éter, resolvía por lo tanto el problema de la relación
entre el éter y la materia, y el problema del modo de acción en el campo
físico. La acción en el campo se propagaba a través de una plenitud etérea, y
el concepto de campo de fuerza podía ser representado a partir del movimiento
de un continuo etéreo.
En su Treatise on electricity and magnetism (1873), Maxwell declaraba que
había traducido las ideas de Faraday en forma matemática, pero la relación
entre Faraday y Maxwell no puede ser planteada simplemente como la de una
matematización. Al ofrecer una expresión matemática de las ideas físicas de
Faraday, Maxwell transformaba los conceptos de Faraday mediante la
formulación de modelos físicos y matemáticos del campo los cuales
proporcionaban una teoría física más comprensiva e intuiciones conceptuales
más profundas. Mientras Kelvin desarrollaba la teoría de un continuo etéreo
entendido como realización física concreta de la plenitud de fuerza de
Faraday, Maxwell exploraba las implicaciones geométricas de las líneas de
fuerza, y desarrollaba también un modelo físico de las partículas de éter
para representar la transmisión de la acción en el campo mediante partículas
contiguas de éter. Maxwell propuso una serie de modelos y desarrolló
sucesivas teorías para evitar las dificultades: la relación entre el modo de
propagación de la fuerza en el campo y la naturaleza de la sustancia material
que constituía la estructura física del campo.
Maxwell cayó en la cuenta de que el concepto de líneas de fuerza de Faraday
podía ser empleado a manera de una representación puramente geométrica de la
estructura del campo. Maxwell deseaba hacer hincapié en la laguna abierta
entre las representaciones matemática y física, pero también indicar las
implicaciones físicas de una representación matemática de la naturaleza.
En su artículo On Faraday's lines of force, Maxwell elaboró un "modelo
geométrico" del campo, en el que la dirección de las fuerzas que
actuaban en el campo se representaba con líneas de fuerza que llenaban el
espacio. Para explicar la intensidad de la fuerza imaginaba un fluido
incompresible que se movía en tubos formados por líneas de fuerza. Denominaba
el modelo geométrico del flujo de fluido una "analogía física" que
presentaba "a la mente las ideas matemáticas en una forma
tangible". Aunque el concepto de flujo de fluido era sugerido por la
analogía matemática entre el flujo de calor y el flujo de fuerza eléctrica,
esta representación geométrica no tenía la categoría de hipótesis física; su
uso se fundamentaba en el "parecido matemático", y su ventaja sobre
un modelo puramente analítico consistía en que el modelo geométrico de líneas,
superficies y tubos ofrecía una representación visual de las líneas de
fuerza, de manera que el fenómeno a explicar permanecía claramente a la
vista. La similitud se daba entre las relaciones matemáticas, no entre los
fenómenos así relacionados.
El modelo geométrico del campo, que representaba a éste mediante líneas de
fuerza, presuponía que se asumiese el espacio absoluto. Para Maxwell el
concepto de espacio absoluto era el fundamento de la cartografía de las
relaciones entre los entes materiales. El campo, tal y como se representaba
geométricamente mediante líneas de fuerza, estaba en el espacio, y el espacio
era una categoría ontológica fundamental, la condición de la existencia del
campo. Para Maxwell una representación física del campo requería la formulación
de una teoría del éter, sustrato del campo.
Maxwell publicó su trabajo On physical lines of force en 1861. Ofrecía una
teoría sistemática de la propagación de las fuerzas eléctricas y magnéticas a
partir de la tensión en un "medio magneto-eléctrico". Suponía que
el campo magnético podía ser representado como un fluido lleno de tubos de
vórtices en rotación, siendo su ordenación geométrica la indicada por las
líneas de fuerza y siendo las velocidades angulares de los vórtices la
intensidad del campo. Sugería una analogía mecánica para explicar la rotación
de los vórtices alrededor de ejes paralelos en la misma dirección: la de una
máquina en la que una "rueda de engranaje" se colocaba entre dos
ruedas que se quería girasen en la misma dirección. Maxwell representaba el
"medio magneto-eléctrico" como un éter celular, descrito como una
colmena. Cada célula consistía en un vórtice molecular circundado por una
capa de partículas del tipo "rueda de engranaje", que sufrirían un
movimiento de traslación si los vórtices adyacentes tuviesen velocidades
angulares diferentes, correspondiendo el movimiento de esas partículas al
flujo de una corriente eléctrica en un campo magnético no homogéneo. La
teoría era una teoría "física" de las "líneas de fuerza",
porque el campo de fuerza se representaba mecánicamente mediante una teoría
de la transmisión de fuerza entre las partículas del éter.
Las reflexiones de Maxwell sobre el status de su modelo de éter habían sido
pensadas para que sirviesen de conclusión de su artículo; de la extensión de
su teoría a la electrostática no se decía nada. Además, el mecanismo de la
transmisión de la rotación de las partículas que hacían de ruedas de
engranaje a los vórtices celulares no estaba claro. Nuevas reflexiones sobre
este problema dieron lugar a una inesperada unificación de la óptica y el
electromagnetismo. Maxwell calculó la velocidad de las ondas elásticas
transversales, que correspondían a la propagación de un desplazamiento
eléctrico en el medio magnético-eléctrico, y halló que las ondas elásticas
transversales se transmitían con la misma velocidad que las ondas de luz.
Llegó a la siguiente conclusión:
Difícilmente podemos eludir la inferencia de que la luz consiste en las
ondulaciones transversales del mismo medio que es la causa de los fenómenos
eléctricos y magnéticos.
La identificación de los medios electromagnético y lumínico fue un gran
desarrollo de la teoría del éter. La unificación de la óptica y del
electromagnetismo mediante la teoría mecánica del éter fue completada con un
tratamiento de la rotación magneto-óptica basado en la teoría de los vórtices
moleculares.
La preocupación de Maxwell por el status de su modelo mecánico de] éter
encontró expresión en su Dynamical theory of the electromagnetic field (1865),
que se basaba en los métodos de la dinámica analítica empleados por Green y
MacCullagh en sus teorías dinámicas del éter, en vez de en la construcción de
un modelo mecánico. El cambio de perspectiva puede apreciarse en su
presentación de su "teoría electromagnética de la luz", como él la
denominaba ahí explícitamente. Aunque la ecuación de ondas se derivaba ahora
de las leyes electromagnéticas, al éter en el que la propagación de la onda
ocurría todavía se le consideraba sujeto a las leyes de la dinámica.
El programa de formulación de un modelo mecánico del éter presentaba dos
dificultades fundamentales. Aunque Maxwell había resaltado el valor
heurístico del modelo de las ruedas de engranaje en la explicación mecánica
de los vórtices moleculares, había el peligro de confundir una hipótesis con
la realidad, suponer que la hipótesis misma era validada por la confirmación
de las conclusiones que de ella se extraían. Además, no había en principio un
límite del número de modelos mecánicos que pudiesen ser propuestos como
hipótesis. Maxwell expresaba el problema con característica claridad en el
Treatise:
El problema de determinar el mecanismo requerido para establecer una especie
dada de conexión entre los movimientos de las partes de un sistema siempre
admite un número infinito de soluciones.
En consecuencia proponía abandonar la analogía mecánica del éter, de manera
que la teoría física de campo pudiese ser formulada independientemente de la
presuposición de cualquier modelo mecánico específico. Al mismo tiempo que
abandonaba todo intento de elaborar un modelo que describiese este mecanismo,
Maxwell seguía empleando términos mecánicos, trasuntos mecánicos de
magnitudes electromagnéticas, cuyo uso era "ilustrativo", no
"explicativo", y resaltaba el marco dinámico de la teoría de campo.
El marco conceptual dinámico se manifiesta claramente en el hecho de que
Maxwell resaltase que el campo era una reserva de energía. Tras argüir que la
energía podía existir sólo en relación con las sustancias materiales, concluía
que el medio etéreo que constituía el campo electromagnético era el depósito
de energía del campo. El complicado mecanismo del éter estaba sujeto a las
leyes de la dinámica, y el campo se representaba dinámicamente bajo la forma
de transformaciones de energía en el éter. La energía en los fenómenos
electromagnéticos había de referirse a la energía cinética del movimiento de
las partes del éter y a la energía potencial almacenada en las conexiones de
la estructura del éter. La propagación de las ondas electromagnéticas era
concebida a manera de unas transformaciones de energía en el éter.
En su Treatise on electricity and magnetlsm (1873), Maxwell usaba la
formulación analítica de la dinámica articulado por Kelvin y Tait en su
Treatíse on natural phllosophy para desarrollar esta interpretación dinámica
del electromagnetismo. El método evitaba considerar explícitamente las
conexiones mecánicas del campo electromagnético, si bien la base dinámica del
formalismo matemático permanecía constantemente a la vista, lo que satisfacía
el criterio de Maxwell de aceptabilidad de los métodos matemáticos en física.
Destacaba la preminencia dada por Kelvin y Tait al principio de conservación
de la energía en la dinámica abstracta. El efecto magneto-óptico indicaba que
el campo estaba constituido por una estructura material sujeta a la rotación
de sus partes constituyentes pero la naturaleza del mecanismo podía ser
ignorada.
En sus escritos tardíos de la década de 1870, Maxwell empezó a simpatizar con
lo que implicaba tocante a la estructura del éter la teoría de Kelvin del
atomismo de vórtice. Observó que la sencillez de los supuestos fundamentales
de la teoría de los átomos de vórtice era una notable virtud. Maxwell hacía
hincapié en que el fenómeno de la rotación magneto-optica indicaba que el
éter tenía una estructura molecular, pero insinuaba que los vórtices
moleculares podían ser discontinuidades en un continuo etéreo, estructuras de
un éter continuo dotadas de la propiedad de la elasticidad. Estas
observaciones sugerían una unificación de la teoría de Maxwell del campo
electromagnético y el concepto de plenitud etérea universal, de Kelvin.
John Henry Poynting eludió el uso de un modelo de éter gracias al
empleo, en la representación del campo, de la distribución de las líneas de
fuerza en el espacio y de un flujo de energía entre las líneas de fuerza. El
campo electromagnético era contemplado como una plenitud homogénea, y los
fenómenos electromagnéticos se explicaban mediante la disposición de las
líneas de fuerza. En 1880, George Francis Fitzgerald desarrolló una teoría de
la plenitud etérea que incorporaba la teoría electromagnética de la luz de
Maxwell. Si Maxwell había vinculado las variables electromagnéticas a la
estructura material del éter, Fitzgerald, por el contrario, dotaba al éter de
propiedades puramente electromagnéticas. Revivía el éter rotacionalmente
elástico propuesto por MacCullagh en 1839. La rotación del sólido elástico de
MacCullagh era representada por la corriente de desplazamiento de Maxwell, y
la velocidad de las corrientes de éter por la fuerza magnética. Empleando
esta analogía electromagnética, Fitzgerald demostraba que la teoría de
Maxwell podía aplicarse al problema de la reflexión y refracción ópticas.
Fitzgerald no postulaba el movimiento del éter, y se limitaba a caracterizar
sus propiedades electromagnéticas. El problema crucial, tal y corno señalaba
Fitzgerald, era la explicación de la interacción del éter y la materia,
necesaria para explicar la rotación magneto-óptica.
Mientras que la teoría ondulatorio de la luz y del electromagnetismo apuntaba
a un éter elástico sujeto a distorsión, el efecto magneto-óptico indicaba que
el éter era rotacional, propiedad representada más satisfactoriamente por los
vórtices en un fluido. El intento llevado a cabo por Kelvin de unificar los
modelos del tipo del sólido elástico y rotacionalmente elásticos del éter
estaba encaminado a resolver esta dificultad. Pero una dinámica comprensiva
del éter se le escapaba.
Joseph Larmor publicó en 1893 su sistemática y sintética Dynamical theory of
the electric and luminiferous medium. Larmor proponía que el éter podía ser
representado como un medio fluido homogéneo, si el éter era do de una
elasticidad rotacional que fuese latente y sólo se manifestase por un
desplazamiento de los elementos del medio etéreo. Para representar la
elasticidad rotacional empleaba un modelo mecánico, el modelo de Kelvin. El
éter de Larmor tenía las propiedades de un fluido perfectamente incompresible
y elástico, y podía, por lo tanto, ser el medio de la propagación de las
ondulaciones transversales. Su teoría se basaba en una función analítica
lagrangiana que especificaba la distribución de energía en el campo. Larmor
mantenía que ese formalismo era una explicación suficiente de la realidad
física. Todo lo que podía ser conocido del éter podía ser enunciado en forma
de ecuaciones diferenciales que definiesen las propiedades de un medio
continuo. Su éter era un "puro continuo", con la elasticidad, la
Inercia y la continuidad de movimiento como sus "únicas y últimas
propiedades fundamentales"; en cambio, la materia ordinaria estaba
compuesta de átomos discretos dotados de inercia, de manera que la
elasticidad de la materia se debía a la interacción y distribución de las partículas
componentes. En su reformulación de su teoría en Aether and matter (1900),
observaba que "la materia puede ser y probablemente es una estructura en
el éter, pero ciertamente el éter no es una estructura hecha de
materia". El éter era físicamente "anterior a la materia, y por lo
tanto no es expresable en términos correspondientes a la materia". La
unidad fundamental de materia era un centro de tensión rotacional en el éter
de vórtices; Larmor suponía que estos centros de tensión estaban dotados de
carga eléctrica, y los denominó "electrones".
La fuerza y las teorías del éter en la física alemana
Las teorías del campo y del éter desarrolladas por los físicos británicos en
el siglo XIX suponían una separación radical de la teoría eléctrica
vislumbrada por Coulomb y Laplace, que postulaban una teoría matemática de
las fuerzas eléctricas análoga a la ley de fuerza central newtoniana de la
gravedad. El uso de un éter que hacía de vehículo o campo para explicar los
fenómenos electromagnéticos, y el sofisticado tratamiento de los modelos
matemáticos y mecánicos del éter por parte de los físicos británicos,
transformaron los presupuestos teóricos de la ciencia eléctrica. En Alemania
hubo un alejamiento, menos radical, pero en todo caso señalado, de la teoría
de la electricidad del tipo de fuerza central. Wilhelm Eduard Weber tuvo el
propósito de unificar los fenómenos de la electricidad y el magnetismo en una
ley de fuerza fundamental, y desarrolló una teoría del éter electromagnético
corpuscular como medio de unificación de los fenómenos electromagnéticos y
ópticos.
La ley de Weber de las fuerzas que actúan a distancia entre las partículas de
los fluidos eléctricos incluía términos que hacían que la fuerza entre dos
partículas eléctricas no dependiese tan sólo del cuadrado de la distancia
entre ellas (tal y como ocurría en la ley de Coulomb de las fuerzas
electrostáticas), sino también de sus velocidades y aceleraciones relativas.
La ley de fuerza de Weber no ofrecía una explicación de las fuerzas
eléctricas, sino meramente una medida cuantitativa de las mismas. Aunque
Weber distinguía entre la matematización de la naturaleza y la representación
de la realidad física, también dejaba claro que su modificación de los
tradicionales conceptos de la fuerza central estaba justificada por su
creencia en que las fuerzas eléctricas se propagaban por medio de un éter
interpuesto análogo al éter lumínico: tenía en mente la teoría de Ampére
según la cual hay un éter eléctrico que llena el espacio y creía vislumbrar
una explicación de la teoría ondulatoria de la luz basada en las oscilaciones
del éter eléctrico que explicaría el efecto magneto-óptico mediante la
rotación del éter eléctrico. La teoría física del éter complementaba la ley
de fuerza matemática de Weber. En la teoría de Weber, la fuerza no actuaba
simplemente de una partícula a otra, sino que vinculaba dos partículas para
formar un "par atómico"; la fuerza existía a manera de una
realización concreta de la relación entre las dos partículas.
Weber intentó vincular su concepto de fuerza a conceptos de energía;
expresaba la fuerza entre dos átomos como la energía potencial del "par
atómico". Helmholtz había criticado la ley de fuerza con el argumento de
que, al presuponer términos dependientes del tiempo en la ley de fuerza eléctrica,
la ley de Weber violaba el principio de conservación de la energía. En
respuesta a los argumentos de Helmholtz, Weber sugirió que el concepto de
conservación de la energía había de ser modificado cuando se aplicaba a la
teoría de la electrodinámica. Desarrolló una concepción eléctrica de la
naturaleza que sometía la afinidad química, la teoría de los gases y el éter
lumínico a una teoría de unificación basada en las partículas eléctricas
fundamentales. Argüía que los pares de átomos eléctricos podían formarse
tanto con partículas iguales como con partículas desiguales. La materia
ordinaria estaba formada por partículas negativas estrechamente ligadas, y el
éter, en cambio, estaba hecho de pares positivos débilmente ligados. La
combinación química se explicaba mediante la distribución de las partículas
negativas, y se hacía que las propiedades de la materia dependiesen de la
naturaleza de las conexiones entre estas partículas y el éter eléctrico. Las
oscilaciones del éter eléctrico explicaban la propagación de las ondas de luz
mediante la transferencia de energía.
Las modificaciones a las que Weber sometió los conceptos de la fuerza central
y su teoría física del éter eléctrico condujeron a que se propusiesen teorías
de la propagación de la fuerza a través del espacio. Bernhard Riemann
representaba una transmisión de la electricidad que, al contrario que en la
teoría de la fuerza central, no ocurría instantáneamente, sino con la
velocidad de la luz, a través del éter lumínico. Carl Neumann explicaba la transmisión
de la acción eléctrica refiriéndola a la propagación de la energía. Aunque
estas teorías ofrecían grandes desviaciones con respecto a la teoría de la
electricidad del tipo de la fuerza central (al apoyar la hipótesis de que la
propagación de la acción eléctrica dependía del tiempo y al presuponer el
papel de vehículo desempeñado por el campo ambiente), diferían de las
explicaciones mecánicas a las que se adherían los físicos británicos, que
postulaban modelos matemáticos mecánicos del éter a manera de realizaciones
materiales del campo.
En un artículo sobre la teoría de la electrodinámica publicado en 1870
Helmholtz se propuso conseguir una síntesis de las innovaciones de la teoría
electromagnética de la luz de Maxwell y de la consistencia formal de una
teoría de la electrodinámica del tipo de fuerza central, así como evitar las
ambigüedades conceptuales que él creía que amenazaban la coherencia de la
electrodinámica de Weber. Helmholtz era totalmente consciente de que la obra
de Maxwell ofrecía una teoría unificada de los fenómenos electromagnéticos, y
de que la teoría electromagnética de la luz de Maxwell era una innovación
conceptual en la teoría física de gran importancia. Intentó formular una
teoría de la electrodinámica del tipo de acción a distancia, coherente con su
fidelidad a la física de la energía, que incorporase la teoría
electromagnética de la propagación de la luz sin introducir una ley de fuerza
dependiente del tiempo. Helmholtz obtuvo una fórmula general que describía la
interacción entre corrientes eléctricas actuando instantáneamente a
distancia, de la cual las leyes de la electrodinámica competidoras (tales
como las de Maxwell y Weber) podían ser deducidas matemáticamente.
La fórmula de Helmholtz no introducía leyes de fuerza dependientes de la
velocidad ni tampoco presuponía la propagación de la fuerza en el tiempo. Sin
embargo, al introducir condiciones de límite, derivó una ecuación de ondas
que representaba la transmisión de los estados de polarización. La
interacción eléctrica de los cuerpos estaba determinada en parte por la
acción directa de fuerzas a distancias, en parte por la polarización del
medio. Las fuerzas a distancia daban lugar a fuerzas que actuaban a distancia
entre las partes polarizadas del medio, y el medio polarizado transmitía las
fuerzas directamente a distancia entre las partes contiguas polarizadas. Al
presentar la teoría electromagnética de la luz como una deducción que se
seguía de su ley de fuerza generalizada, Helmholtz incorporaba la teoría
electromagnética de la luz en el marco aceptado de la teoría electrodinámica,
si bien transformó por completo la base física de la teoría de Maxwell en el
proceso.
Los físicos continentales se familiarizaron con la obra de Maxwell por medio
de la versión de Helmholtz de la teoría electromagnética de la luz. En la
década de 1870, Hertz y Lorentz llegaron a la teoría electromagnética de la
luz de Maxwell gracias a la teoría de fuerza central imaginada por Helmholtz.
Los famosos experimentos de Hertz sobre la propagación de las ondas
electromagnéticas fueron concebidos en respuesta a un problema que Helmholtz
había propuesto cuando Hertz era alumno suyo, una prueba experimental de la
relación entre la polarización y los efectos electromagnéticos. Hertz hizo
dos contribuciones fundamentales al desarrollo de la teoría de campos: la
verificación directa de la propagación de las ondas electromagnéticas, y una
crítica radical de la estructura conceptual de las ecuaciones de campo del
Treatise de Maxwell, que condujo a Hertz a reformular las ecuaciones de
Maxwell del electromagnetismo.
A la hora de presentar en el Treatise pruebas que apoyasen su teoría
electromagnética, Maxwell había apelado principalmente a los fenómenos
ópticos, y hecho hincapié en su derivación de la fórmula de la propagación de
la luz. Propuso el éter electromagnético como medio de la propagación de la
luz, y al parecer no vislumbró la posibilidad de una detección experimental
directa de las ondas electromagnéticas. Hertz exploró las relaciones entre el
campo y las teorías de la electrodinámica del tipo de fuerza central, y los
supuestos de Maxwell concernientes a la propagación de la fuerza eléctrica
eran compatibles con las leyes conocidas de la electrodinámica. Sin embargo,
rehusó adherirse a una hipótesis física acerca de un éter electromagnético y
sostuvo la opinión de que las pruebas de la propagación de las fuerzas
eléctricas y magnéticas debían buscarse en los fenómenos electromagnéticos,
en vez de en los ópticos.
Observó que la hipótesis de una sustancia que llena el aire y el espacio
vacío, sujeta a polarización eléctrica y magnética, era el núcleo de la
teoría de campo de Maxwell. La detección de ondas electromagnéticas
confirmaría que había una sustancia que llenaba el aire, sujeta a polarización
electromagnética, y, por lo tanto, confirmaría la teoría del éter
electromagnético.
En una serie de experimentos fundamentales realizados en los años 1887-1888,
Hertz produjo ondas eléctricas con un alambre conectado a una bobina de
inducción, y las detectó mediante un pequeño aro de alambre con un pequeño
corte en el que se podían observar chispas cuando se inducían corrientes.
Llegó a la conclusión de que estos experimentos dejaban sentada la
"identidad de la luz, el calor radiante y el movimiento ondulatorio
electromagnético". Los experimentos de Hertz produjeron una violenta
conmoción en los físicos continentales, que les llevó a la aceptación del
concepto de campo electromagnético. El físico holandés Henrik Antoon Lorentz
señaló su aceptación de la teoría del campo electromagnético al declarar que
los experimentos de Hertz eran "el mayor triunfo que Maxwell había
obtenido".
La adhesión de Hertz al éter de Maxwell y su insatisfacción con la
consistencia formal del Treatise le llevaron a buscar una formulación
axiomático de la teoría de Maxwell del campo electromagnético. A Hertz le
preocupaba la relación entre la polarización del éter y el desplazamiento de
electricidad. Su solución al problema consistía en eliminar el desplazamiento
como concepto independiente del concepto de fuerza eléctrica, eludiendo así
la necesidad de explicar si un desplazamiento de carga eléctrica era causa o
efecto de la polarización. En la axiomatización de Hertz de las ecuaciones
del campo electromagnético, el desplazamiento se eliminaba en favor de una
formulación basada en las relaciones simétricas entre las fuerzas eléctricas
y magnéticas. La formulación axiomático de Hertz de las ecuaciones del campo
evitaba las "representaciones concretas" de los conceptos electromagnéticos
empleadas por Maxwell. La simplificación que Hertz impuso al formalismo del
campo electromagnético contribuyó mucho a que la teoría fuese aceptada.
EINSTEIN, La teoría de la relatividad.
ESPACIO Y TIEMPO EN LA MECÁNICA CLÁSICA
Si yo formulara la tarea de la mecánica del siguiente modo: «La mecánica debe
describir cómo varía con el tiempo la posición de los cuerpos en el espacio»,
sin añadir prolijas consideraciones y explicaciones detalladas, estaría
cargando sobre mi conciencia algunos pecados mortales contra el santo
espíritu de la claridad; en primer lugar, descubramos estos pecados.
No está claro lo que hay que entender aquí por «posición» y «espacio». Me
encuentro en la ventanilla de un vagón de ferrocarril animado de un
movimiento uniforme y dejo caer una piedra sobre el terraplén, sin comunicar
a aquélla impulso alguno. Veré entonces (prescindiendo de la influencia de la
resistencia del aire) que la piedra cae en línea recta. Un peatón que observa
la fechoría desde la carretera nota que la piedra cae a tierra según un arco
de parábola, Pregunto ahora: las «posiciones» que recorre la piedra, ¿se
hallan «en realidad» sobre una recta o sobre una parábola? ¿Qué significa
además aquí el movimiento «en el espacio»? A partir de las consideraciones hechas
en el § 2, la respuesta es evidente. En primer lugar dejamos a un lado la
oscura palabra «espacio», bajo la cual - reconozcámoslo sinceramente - no
podemos formarnos ni el más ligero concepto, y la sustituimos por «movimiento
con respecto a un cuerpo de referencia prácticamente rígido». Las posiciones
con respecto al cuerpo de referencia (vagón de ferrocarril o suelo de la
tierra) fueron ya definidas con detalle en la sección anterior. Si en lugar
de «cuerpo de referencia» introducimos el concepto de «sistema de
coordenadas», concepto útil con vistas a una descripción matemática, podemos
decir entonces: respecto a un sistema de coordenadas rígidamente unido al
vagón, la piedra describe una recta; respecto a un sistema de coordenadas
rígidamente unido al suelo, una parábola. En este ejemplo se ve claro que no
existe ninguna trayectoria propiamente dicha, sino sólo trayectorias con
relación a un cuerpo de referencia determinado.
Ahora bien, no existirá una descripción completa del movimiento en tanto no
se especifique cómo varía la posición del cuerpo con el tiempo, es decir,
para cada punto de la trayectoria hay que especificar en qué momento se
encuentra allí el cuerpo. Estos datos han de completarse con una definición
de tiempo tal que, en virtud de ella, podamos considerar esos valores del
tiempo como magnitudes esencialmente observables (resultados de mediciones).
En el caso de nuestro ejemplo - y moviéndonos en el terreno de la mecánica
clásica - podemos satisfacer ese requisito de la manera siguiente. Imaginemos
dos relojes de idéntica construcción, uno de ellos en manos del hombre que
está en la ventanilla del vagón de ferrocarril y el otro en manos del hombre
que se encuentra en el camino de peatones. Cada uno de ellos determina en qué
lugar de su propio cuerpo de referencia se halla la piedra cada vez que el
reloj que tiene en su manó marca un «tic». Aquí prescindiremos del análisis
de la imprecisión introducida como consecuencia de la finitud de la velocidad
de propagación de la luz. De ello y de una segunda dificultad que también
prevalece aquí hablaremos con detalle más adelante.
EL PRINCIPIO DE LA RELATIVIDAD (EN SENTIDO RESTRINGIDO)
Con el fin de alcanzar la máxima claridad partiremos una vez más del ejemplo
del vagón del ferrocarril que viaja uniformemente. Su movimiento lo
denominamos traslación uniforme («uniforme» porque su velocidad y dirección
son constantes, «traslación» porque si bien el vagón varía de posición con
respecto al terraplén, al hacerlo no ejecuta rotación alguna). Imaginemos que
un cuervo vuela en línea recta y uniformemente - visto desde el terraplén -
por los aires. Observado desde el vagón en marcha, el movimiento del cuervo
sería ciertamente un movimiento de distinta velocidad y distinta dirección,
pero seguiría siendo rectilíneo y uniforme. Expresado lo mismo de un modo
abstracto podemos decir: si una masa m se mueve rectilínea y uniformemente
con respecto a un sistema de coordenadas K, también se moverá rectilínea y
uniformemente con respecto a un segundo sistema de coordenadas K', siempre
que este último ejecute con respecto a K un movimiento de traslación
uniforme. Teniendo en cuenta la digresión de la sección anterior, se sigue
que:
Si K es un sistema de coordenadas de Galileo [Es decir, el sistema de
coordenadas de la mecánica clásica, si un individuo A, que se mueve en la
dirección X con la velocidad V1 relativa a un observador B, tirase una piedra
hacia adelante con la velocidad V2, la velocidad en el sistema de referencia
de A (V2) quedaría transformada en la velocidad con respecto al sistema de
referencia B sin más que sumarla a la velocidad de A (V1)], entonces también
será de Galileo cualquier otro sistema de coordenadas K' que con respecto a K
posea un movimiento de traslación uniforme. Con respecto a K' las. leyes de
la mecánica de Galileo-Newton son igual de válidas que con respecto a K.
Demos un paso más en el proceso de generalización y expresemos el siguiente
principio: si K' es con respecto a K un sistema de coordenadas animado de un
movimiento uniforme y libre de rotación, entonces los sucesos de la
naturaleza transcurren con respecto a K' según unas leyes generales que son
exactamente las mismas que con respecto a K. Esta afirmación la denominamos
«principio de la relatividad» (en sentido restringido).
El segundo argumento, sobre el que volveremos más adelante, es el siguiente.
Si el principio de la relatividad (en sentido restringido) no es válido,
entonces los sistemas de coordenadas de Galileo, K, K', K", etc., que se
mueven uniformemente unos con respecto a otros, no serán equivalentes a la
hora de describir los sucesos de la naturaleza. No tendríamos por menos
entonces que pensar que las leyes de la naturaleza sólo se podrían formular
de una manera sencilla y natural si de entre todos los sistemas de coordenadas
de Galileo erigiésemos uno (K0), con un estado de movimiento determinado,
como cuerpo de referencia. A este sistema lo calificaríamos con toda razón
(por sus excelencias en la descripción de la naturaleza) de «absolutamente en
reposo», mientras que de todos los demás sistemas K de Galileo diríamos que
son «móviles». Por ejemplo, si el terraplén fuese el sistema K0, nuestro
vagón de ferrocarril sería un sistema K con relación al cual se cumplirían
leyes menos sencillas que con respecto a K0. Esta menor simplicidad sería
imputable al hecho de que, con respecto a K0, (es decir, «realmente»), el
vagón K se halla en movimiento. En las leyes generales de la naturaleza
formuladas con respecto a K tendrían que desempeñar cierto papel la magnitud
y la dirección de la velocidad de marcha del vagón. Por ejemplo, sería de
esperar que el tono de un tubo de órgano fuese distinto al colocar este
último con su eje paralelo a la dirección de marcha que al colocarlo
perpendicular a la, misma. Ahora bien: debido a su movimiento orbital en
torno al sol, nuestra tierra es comparable a un vagón que viajase a una
velocidad de unos 30 km. por segundo. Por consiguiente, en el caso de que el
principio de la relatividad no fuere válido, sería de esperar que la
dirección del movimiento de la tierra en cada momento interviniese en las
leyes de la naturaleza y que, por ende, el comportamiento de los sistemas
físicos dependiese de la orientación espacial con respecto a la tierra. Pues
debido a la alteración que en el transcurso del año se opera en la dirección
de la velocidad de revolución de la tierra, ésta no puede hallarse todo el
año en reposo con relación al hipotético sistema K0. Sin embargo, y pese al
esmero que se ha puesto en ello, jamás se ha logrado observar una tal anisotropía
del espacio físico terrestre, es decir, una no-equivalencia física de las
distintas direcciones. Esto constituye un argumento de peso en favor del
principio de la relatividad. (...)
LA APARENTE INCOMPATIBILIDAD DE LA LEY DE PROPAGACIÓN DE LA LUZ CON EL
PRINCIPIO DE LA RELATIVIDAD
Apenas existe en la física una ley más sencilla que la de la propagación de
la luz en el espacio vacío. Cualquier escolar sabe, o cree saber, que esta
propagación se produce en línea recta con una velocidad c = 300.000 km/seg.
En cualquier caso, sabemos con gran exactitud que esta velocidad es la misma
para todos los colores; pues si no fuese así, el mínimo de emisión en el
eclipse de una estrella fija por parte de su compañera oscura no se
observaría simultáneamente para los distintos colores. A través de una
consideración análoga, relacionada con las observaciones de las estrellas
dobles, el astrónomo holandés De Sitter logró también demostrar que la
velocidad de propagación de la luz no puede depender del cuerpo que emite la
luz. La hipótesis de que esta velocidad de propagación depende de la
dirección «en el espacio» es en sí misma improbable.
En resumen, supongamos que el escolar crea justificadamente en la sencilla
ley de la constancia de la velocidad c de la luz (en el vacío). ¿Quién
hubiera pensado que esta sencilla ley sumiría a los concienzudos físicos en
grandísimas dificultades intelectuales? Estas dificultades surgen del
siguiente modo.
Naturalmente, el proceso de la propagación de la luz hay que referirlo, como
cualquier otro, a un cuerpo de referencia rígido (sistema de coordenadas).
Como tal elegimos de nuevo el terraplén del ferrocarril. El aire que flotaba
por encima del mismo supondremos que ha sido eliminado por bombeo. Imaginemos
que a lo largo del terraplén se envía un rayo de luz cuyo vértice se propaga
- de acuerdo con lo antedicho - con la velocidad c relativa al terraplén.
Supongamos una vez más que por los carriles se desplaza nuestro vagón de tren
con una velocidad v, en la misma dirección en que se propaga el rayo de luz,
pero, naturalmente, mucho más despacio. Queremos averiguar la velocidad de
propagación del rayo de luz con relación al vagón. Fácilmente se ve que las
consideraciones de la sección anterior son aplicables a este caso, donde el rayo
de luz desempeña el papel del hombre que corría con respecto al vagón de
ferrocarril. En lugar de la velocidad W del hombre con respecto al terraplén
aparece aquí la velocidad de la luz relativa al mismo terraplén; w es la
velocidad de la luz con respecto al vagón, es decir, la velocidad que
buscamos y para la cual se cumple:
w = c - v.
Por consiguiente, la velocidad de propagación del rayo de luz con respecto al
vagón resulta ser menor que c.
Este resultado atenta, empero, contra el principio de la relatividad que
expusimos en el § 5. Pues la ley de la propagación de la luz en el vacío,
como cualquier otra ley general de la naturaleza, debería ser, según el
principio de la relatividad, la misma, ya tomemos como cuerpo de referencia
el vagón de ferrocarril o las vías del tren. Mas de acuerdo con nuestras
consideraciones esto parece imposible. Si cualquier rayo de luz se propaga en
relación con el terraplén a la velocidad c, parece que, precisamente por eso,
la ley de propagación de la luz con respecto al vagón debería ser otra
distinta, en contradicción con el principio de la relatividad.
Ante este dilema parece inevitable abandonar o el principio de la relatividad
o la sencilla ley de propagación de la luz en el vacío. No cabe duda de que
el lector que haya seguido atentamente las anteriores explicaciones esperará
que haya que mantener el principio de la relatividad, cuya naturalidad y
simplicidad lo hacen casi irrechazable para el intelecto, sustituyendo en
cambio la ley de propagación de la luz en el vacío por una ley más complicada
y compatible con el principio de la relatividad. Sin embargo, el desarrollo
de la física teórica demostró que este camino no es transitable. Las
investigaciones teóricas de H. A. Lorentz sobre los procesos electrodinámicos
y ópticos de los cuerpos en movimiento - investigaciones que marcaron nuevos
rumbos en la física - demostraron que las experiencias en estos terrenos
conducen necesariamente a una teoría de los fenómenos electromagnéticos que
tiene como consecuencia irrefutable la ley de la constancia de la velocidad
de la luz en el vacío. Por esta razón, los teóricos más eminentes se
inclinaban más bien por desechar el principio de la relatividad, pese a que
no se había encontrado ni un solo hecho empírico que lo contradijera.
Aquí es donde entró la teoría de la relatividad. A través de un análisis de
los conceptos físicos de tiempo y espacio se puso de manifiesto que en
realidad no existe incompatibilidad alguna entre el principio de la
relatividad y la ley de propagación de la luz, sino que, por el contrario,
aferrándose sistemáticamente a estas dos leyes se llegaba a una teoría
lógicamente perfecta. A continuación expondremos las ideas fundamentales de
esta teoría que, con el fin de diferenciarla de otra más amplia que más tarde
comentaremos, denominamos «teoría especial de la relatividad».
BERKSON: "Las teorías de los campos de fuerza. Desde
Faraday hasta Einstein"
Capítulo 9: Lorentz)
Las teorías del éter: los problemas del éter:
Los experimentos de Hertz constituyeron un gran éxito para la teoría de
Maxwell y para el programa de investigación británico, empeñado en explicar
todos los fenómenos mediante un éter. De ahí que los problemas relacionados
con el éter se hiciesen cada vez más urgentes. Los esfuerzos por dar solución
a estos problemas llevarían al abandono de todo el programa del éter mecánico
y a su reemplazamiento por la teoría de la relatividad.
Había dos tipos de problemas relacionados con el éter: la explicación,
mediante un mecanismo del éter, de acciones conocidas, tales como la luz o la
atracción eléctrica; y el intento de comprender el alcance del fenómeno de
arrastre del éter por la materia moviéndose en su seno. El primer problema,
el de la explicación mecánica, era evitable en el sentido de que no era
necesario resolverlo para poder aplicar la teoría existente de la luz y del
electromagnetismo, es decir la teoría de Maxwell. Pero el otro problema, el
del "arrastre del éter", era insoslayable, aun en la
"interpretación operativa". Se suponía que las ecuaciones de
Maxwell eran válidas para el éter porque las fuerzas eléctricas y magnéticas,
fuese cual fuera su naturaleza, residían allí. Por lo tanto, el campo
producido dependería de que el éter se moviera con los cuerpos o permaneciera
en reposo. Fue este segundo problema el que abordó Lorentz.
Puede decirse que las teorías del éter son conatos de una teoría unificada
del campo, pero basados en la dinámica newtoniana. Todas tienen un fallo: que
no pueden explicar por qué se mantiene unida una partícula.
La mecánica del éter
Cabe clasificar los distintos intentos de hallar una mecánica del éter en dos
tipos: las teorías que afirman que el éter es un fluido "perfecto",
y las que atribuyen al éter las propiedades de un sólido elástico.
La teoría de los remolinos de Kelvin y otros es un intento de explicar la
materia como un remolino del éter. Helmholtz demostró matemáticamente que un
remolino en el seno de un fluido perfecto es eterno: el fluido por sí mismo
es incapaz de destruirlo. Esta teoría neocartesiana de los átomos de remolino
nunca llegó muy lejos, aunque sí tuvo cierta influencia. J. J. Thomson
escribió un tratado sobre los átomos de remolino que llegaba a la conclusión
de que los fenómenos aparecerían más nítidamente en un vacío mayor, lo cual
le condujo al descubrimiento del electrón.
El sólido elástico sirvió de punto de partida para otras teorías del éter. Y
una vez más fue Kelvin quien más destacó por su ingenio. En términos
generales puede decirse incluso que la historia de la mecánica del éter en la
segunda mitad del siglo XIX es en gran medida la historia del esfuerzo de
Kelvin por crear una mecánica viable del éter. El intento de hallar un sólido
elástico que transmitiera ondas como las luminosas comenzó con la renovación
de la teoría ondulatoria de Young y Fresnel. Pero un sólido elástico
ordinario transmitiría tanto ondas longitudinales como transversales. Y parte
de las ondas transversales se convertirían en longitudinales por sucesivas
reflexiones o refracciones. Sin embargo, nunca se habían observado ondas
longitudinales en el caso de la luz. Los problemas aumentaron con el
electromagnetismo, ya que no había sólido elástico ordinario que pudiera
sustentar las tensiones de Maxwell. No hubo ninguna mecánica del éter que
consiguiera identificar las fuerzas eléctricas y magnéticas con alguna
propiedad del éter mecánico, y no precisamente por no ser buscada.
La única teoría del éter que consiguió dar ecuaciones eléctricas y magnéticas
fue la de Maxwell. Aunque bastantes autores propusieron variantes del modelo
de Maxwell, a este éter nunca se le asignaron propiedades consistentes. Para
resumir, diremos que las teorías de la mecánica del éter constituyeron en
general notables e ingeniosos fracasos, Ahora bien, el más fantástico de
todos los mecanismos, el de Maxwell, había demostrado ser enormemente
fecundo. Fueron la teoría de la relatividad y el abandono de la teoría de
Newton, y no el fracaso temporal de las teorías del éter, lo que determinó su
muerte.
El éter y los cuerpos en movimiento
Después del desarrollo de la teoría de Maxwell, el problema quizá más
importante que quedaba pendientes era la electrodinámica de los cuerpos en
movimiento. Quedaban también los problemas relacionados con la interacción
entre materia y electricidad (por ejemplo, la teoría de los dieléctricos, la
teoría de la corriente, la de la electroquímica, y la relación entre calor y
radiación). Y, muy importante, seguía pendiente la cuestión de la naturaleza
del enlace químico.
La razón de que el problema de los cuerpos en movimiento fuese capital es de
orden metafísico: la electrodinámica de los cuerpos en movimiento atañe
directamente a la naturaleza y existencia del éter. El problema podría
expresarse de la forma siguiente: Cuando la materia cargada se mueve a través
del espacio ¿qué ocurre con las líneas de fuerza? ¿Son arrastradas
completamente o se quedan atrás? La hipótesis de que el éter acompaña a la
materia que se mueve en su seno fue enunciada por Hertz, mientras que la
hipótesis contraria, que la materia en movimiento no perturba al éter, la
formuló Lorentz.
La observación de las estrellas puso de manifiesto por primera vez la
necesidad de una teoría del movimiento del éter. La tierra se mueve en
direcciones opuestas (con respecto a las estrellas) en diferentes épocas del
año; como resultado de ello, la dirección aparente de las estrellas varía
ligeramente en el transcurso del año. El fenómeno se conoce con el nombre de
aberración estelar (el movimiento anual aparente de cada estrella por una
pequeña elipse, lo que se debe al hecho de que la tierra se mueve y que la
luz proveniente de las estrellas emplea algún tiempo en llegar a la tierra) y
fue descubierto en 1728 por James Bradley. Por ser el único efecto conocido
que podía atribuirse al movimiento de la tierra a través del éter, su interés
era capital.
¿Cómo puede explicarse la aberración con una teoría del éter? La cuestión se
planteó inmediatamente cuando Young hizo revivir la teoría ondulatoria.
Fresnel la resolvió suponiendo que el éter no se deja arrastrar por la
materia en movimiento. Con el "éter de Fresnel" se obtienen los
mismos resultados que con la teoría corpuscular de la luz; la hipótesis
fundamental es qué el movimiento relativo al rayo de luz coincide con el
movimiento relativo al éter. Y esto hace que el movimiento relativo del rayo
de luz y el telescopio sea el mismo que en la teoría corpuscular de Newton.
La hipótesis de Fresnel de que la tierra se desliza a través del éter sin
perturbarlo en absoluto resultaba, sin embargo, bastante sorprendente. El
primer intento de contrastar la teoría de Fresnel se debió a Arago, quien
midió el ángulo de salida de un rayo de luz a través de un prisma, en
relación con el ángulo de incidencia. En el rayo observado no aparecía nada
que indicara el fenómeno de aberración. Sin embargo, el fenómeno debía tener
lugar si el prisma se desliza por el éter sin arrastrarlo. Para salir del
impasse, Fresnel propuso lo siguiente: el prisma en movimiento arrastra
consigo a la luz (no al éter). La nueva velocidad sería la antigua más una
tracción de la velocidad del prisma a través del medio:
V = Vant. + k Vprisma.
Al calcular qué valor tenía que tener la constante para que el resultado del
experimento de Arago fuera siempre negativo, Fresnel descubrió que el
"coeficiente de arrastre" era k = (1-1/n2), siendo n el índice de
refracción. Fresnel halló una explicación plausible de esta fórmula. Si se
supone que se condensa algo de éter en el prisma, siendo la cantidad
condensada proporcional a n, se obtiene el coeficiente anterior. Fizeau
confirmó el "coeficiente de arrastre" de Fresnel en un experimento
independiente.
El experimento de Fizeau data de 1851. Unos años antes, Stokes había
propuesto una teoría alternativa de la aberración. Stokes había evitado el
tener que suponer que la materia es completamente permeable al éter, con la
hipótesis de que la tierra en movimiento arrastra consigo totalmente al éter
sin producir ningún remolino. En la teoría de Stokes, la velocidad del éter
en la superficie de la tierra era la misma que la velocidad de ésta, para
luego ir disminuyendo hacia afuera. Lejos de la tierra se suponía que estaba
en reposo en relación con las estrellas. La aberración puede entonces
explicarse como la velocidad del éter a través del cual se propaga el rayo de
luz. La velocidad del éter, sumada a la del frente de ondas lumínicas, hará
que éste gire un ángulo que resulta ser el de aberración. La dificultad más
grave es que la teoría de Stokes no explica el coeficiente de Fresnel.
Algunos de los primeros artículos de Lorentz versaban sobre las dificultades
de la teoría de Stokes y de un posible compromiso entre Stokes y Fresnel.
Lorentz señaló además otros problemas. Por ejemplo, que es imposible que el
éter sea un fluido incompresible y que se mueva a la misma velocidad que la
superficie de la tierra sin que en él se produzcan remolinos, echando así por
tierra la explicación de Stokes de la aberración. Pero, además del
experimento de Fizeau hubo otra prueba de la teoría de Fresnel que fue de
máxima importancia para el desarrollo de la teoría de Lorentz, y por tanto,
de la de Einstein: el famoso experimento de Michelson-Morley.
El experimento de Michelson
La teoría de Fresnel del coeficiente de arrastre, junto con la teoría óptica
ondulatoria, predecía que ningún experimento óptico podría detectar el
movimiento a través del éter si el aparato experimental no tenía capacidad
para detectar diferencias del orden de (v/c)2, siendo v la velocidad del éter
(aproximadamente la de la tierra en su movimiento alrededor del sol), y c la
velocidad de la luz.
A. A. Michelson, un americano que estudiaba con Helmholtz, ideó un método que
llevó a la práctica en el laboratorio de su maestro. La idea crucial del
experimento ya había sido sugerida por Maxwell. La idea era que el éter podía
ser detectado por el hecho de que un rayo de luz emitido por una fuente en
movimiento tardaría tiempos diferentes en el camino de ida y en el de vuelta.
Michelson inventó un sistema basado en fenómenos interferenciales con el que
poner en marcha un experimento suficientemente sensible como para detectar el
efecto.
La idea de Michelson era enviar simultáneamente dos rayos de luz (procedentes
de una misma fuente) en direcciones perpendiculares, hacerles recorrer
distancias iguales y recogerlos, tras una reflexión, en un punto común. Las
fases de los dos rayos de luz se podían comparar estudiando su interferencia.
Uno de los rayos tardaría más que el otro, dependiendo de la orientación del
dispositivo con respecto al éter. La primera vez que Michelson hizo el
experimento no se observó ningún desplazamiento del patrón de interferencias,
ni tampoco, por tanto, ningún viento del éter según la teoría de Fresnel.
Michelson sacó como conclusión que Fresnel estaba equivocado y que la teoría
de Stokes era la correcta. Lorentz revisó los presupuestos teóricos del
experimento por si hubiera alguna equivocación. Descubrió que Michelson se
había equivocado en los cálculos del corrimiento de fase y que el experimento
no era lo suficientemente preciso para detectar un desplazamiento de la
magnitud prevista. Bastaba, sin embargo, con alargar los brazos del aparato
para conseguir la precisión necesaria. Esto fue lo que hizo Michelson. Con la
ayuda de Morley, repitió el experimento en el año 1887 en Chicago, esta vez
con un cuidado exquisito. El resultado fue otra vez negativo, sólo que ahora
no había manera de refutar el experimento, que fue repetido luego muchas
veces en condiciones diferentes. La teoría del arrastre del éter estaba en
apuros. La teoría de Stokes no explicaba el coeficiente de Fresnel, ni la de
Fresnel el experimento de Michelson. Además del experimento de Michelson se
realizaron posteriormente otros de carácter más puramente eléctrico con el
objetivo de descubrir "la corriente del éter. Estos experimentos
confirmaron independientemente el resultado de Michelson.
El problema de reconciliar la teoría de Maxwell con los experimentos sobre el
éter era capital, y de él dependía la naturaleza de la teoría de campos. Lo
que hacía falta era una teoría electromagnética que explicara por qué el éter
se había mostrado hasta entonces indetectable, y que explicara también el
coeficiente de Fresnel. Este fue el problema que abordó Lorentz, y que
constituyó el comienzo de una nueva teoría de campos.
Lorentz: la creación de la teoría de los electrones
La idea más importante de Lorentz fue la teoría de los electrones que, nada
más exponerla, se convirtió en el punto de partida de todas las posteriores
teorías del electromagnetismo y de todas las teorías físicas en general. Para
resolver el impasse de la teoría de campos, Lorentz adoptó un nuevo punto de
vista. Supuso, primero, que todos los cuerpos cargados contienen minúsculas
partículas cargadas, y segundo, que estas partículas obedecen las ecuaciones
de Maxwell en un éter en perfecto reposo. Lorentz combinó así las viejas
teorías de Weber que suponen que toda la electricidad se debe a pequeñas
partículas cargadas que actúan a distancia, con la teoría de Maxwell, que
rechaza la acción a distancia. Maxwell conservó la idea de Faraday de que la
carga era un efecto del medio que existe entre los cuerpos, y no un fluido.
Ese maridaje entre escuelas diferentes no resultaba nada cómodo, por la
dificultad de incorporar el electrón a la teoría de Maxwell. Lo que hizo Lorentz
fue aplicar la teoría de Maxwell, ampliada por Heaviside, a los hipotéticos
corpúsculos cargados. (Estos no recibirían el nombre de electrones hasta
después del descubrimiento del electrón por J. J. Thomson).
Según el punto de vista de Lorentz, el campo está constituido por fuerzas en
el éter debidas a la existencia de cargas que pueden estar en movimiento. En
la teoría de Maxwell, la velocidad de propagación de una onda en un
dieléctrico depende de la constante dieléctrica. En la teoría del electrón no
se puede suponer este resultado, hay que deducirlo a partir de las ecuaciones
fundamentales para los electrones libres y del supuesto de que un dieléctrico
está constituido por diminutas partículas cargadas que de alguna forma están
unidas entre sí elásticamente. Cuando el tren de ondas pasa por uno de esos
pares de cargas positiva y negativa unidas elásticamente, tiende a unir y
desunir rítmicamente el par de cargas, pues la fuerza eléctrica cambia
periódicamente de dirección. El doblete oscilante actúa como un oscilador
hertziano y emite sus propias ondas, que interfieren con las incidentes. El
resultado de la interferencia es esa disminución de la velocidad de la onda
que se observa cuando un rayo de luz atraviesa un objeto transparente. La
vibración de los dobletes depende de la intensidad de la fuerza elástica que
mantiene unido el doblete.
Lorentz había conseguido explicar la relación, ya predicha por Maxwell, entre
el índice de refracción y la constante dieléctrica. La explicación del
coeficiente de arrastre de Fresnel es la siguiente: si suponemos que el
objeto transparente está en movimiento, las ondas que pasan por encima
polarizan los dobletes, y éstos, al moverse, producen un campo magnético. El
campo magnético altera la vibración de los dobletes, las ondas por ellos
producidas y finalmente también el frente de ondas. Lorentz descubrió que el
efecto total producido era un cambio de la velocidad del frente de ondas en
la cantidad exacta que Fresnel había predicho. Lorentz había resuelto un
problema que ninguna otra teoría podía resolver.
Las transformaciones de Lorentz
Lorentz había creado una nueva teoría a base de otras tres ya existentes: la
teoría electromagnética de Maxwell, la teoría del éter de Fresnel y las
viejas teorías corpusculares de la carga. Demostró que la nueva teoría
explicaba un hecho fundamental de la óptica de los cuerpos en movimiento, el
coeficiente de arrastre de Fresnel. Era necesario que Lorentz demostrara su
viabilidad probando que los resultados de todos los experimentos conocidos
sobre la luz y la electricidad eran compatibles con su teoría. Pero había una
dificultad grave: el resultado negativo del experimento de Michelson -
Morley. Según la teoría de Fresnel, el resultado tenía que haber sido
positivo, de modo que el experimento parecía refutar una de las hipótesis
fundamentales de la teoría de Lorentz.
Se le ocurrió suponer que la línea que une los dos puntos de un cuerpo sólido
que inicialmente sigue la dirección del movimiento de la tierra, no conserva
la misma longitud cuando el cuerpo gira 90 grados. Esto suponía que la
longitud de los brazos del aparato de Michelson sufrió cierta variación. La
idea no era tan arbitraria, pues concernía a la magnitud de las fuerzas
moleculares sobre las que, en la época, poco o nada se conocía. Heaviside y
Lorentz habían deducido independientemente que el campo de fuerzas creado por
una carga en movimiento era como el campo en reposo, pero aplastado en la
cantidad en la dirección de movimiento de la carga. Este era exactamente
el grado de distorsión necesario para acortar el brazo que apunta en la
dirección del "viento del éter" en el experimento de Michelson. Por
tanto, el experimento se puede explicar con sólo trasladar el resultado de la
teoría electromagnética a las fuerzas moleculares. Este es el primer ejemplo
de la extensión de la teoría electromagnética de Maxwell a la mecánica de
todos los cuerpos.
Lorentz tenía que volver a explicar todos y cada uno de los fenómenos ópticos
y electromagnéticos sobre la tierra, ya que su teoría establecía que todo
cuerpo terrestre se mueve rápidamente a través del éter. Para ser más
concretos, lo que tenía que demostrar es que, en su teoría, un sistema en
movimiento se comporta como si fuera un sistema en reposo. Para resolver el
problema se le ocurrió utilizar el artificio matemático de transformación de
coordenadas. Se conocía desde hacía siglos la llamada "transformación de
Galileo" que, por ejemplo, permite aplicar las leyes de Newton al choque
de dos bolas de billar que se mueven sobre una mesa situada en un barco que
se aleja de la orilla. Esta "transformación de Galileo" es útil
para describir el movimiento de un sistema con movimiento uniforme. Podemos
calcular el movimiento de las partes del sistema como si estuviera en reposo
y después aplicar la transformación para describir la trayectoria tal y como
se ve desde el sistema del observador.
El hecho de que las leyes de la mecánica newtoniana sean indiferentes a la
velocidad constante de un sistema se conoce como principio de la relatividad.
Lorentz escribió su propia versión de las ecuaciones de Maxwell para el caso
de un sistema en movimiento uniforme. Después trató de eliminar la variable
velocidad del sistema. En 1895 en un estudio de los problemas de los cuerpos
en movimiento titulado: "Hacía una teoría de los fenómenos eléctricos y
ópticos en los cuerpos en movimiento" introdujo las transformaciones
para explicar los sistemas electrostáticos en movimiento. Básicamente, estas
transformaciones establecían que el campo de una partícula cargada dotada de
movimiento uniforme se contrae en la dirección del movimiento en un
factor . v era la velocidad de la tierra con respecto al éter, que, se
creía, coincidía con la velocidad de la tierra en torno al sol, unos 30
Km./seg. Por ello, el cociente (v/c)2 era pequeñísimo (del orden de 10-8),
por lo que la introducción del factor de transformación no tenía efectos
detectables en los resultados experimentales predichos (la única excepción
era el experimento de Michelson-Morley debido a la altísima sensibilidad del
aparato).
El siguiente paso era introducir transformaciones para electrones acelerados
que emiten radiación. Su solución era crucial, porque todos los efectos
ópticos dependían de él. Lo resolvió mediante el recurso de transformar la
variable tiempo del sistema en movimiento, artificio que supuso un importante
avance en la teoría de Lorentz, pues le permitió demostrar que el movimiento
de la tierra no debería provocar efectos de primer orden, sino de segundo
(esto es, no dependían de v/c sino de (v/c)2).
El hecho clave en esta situación es que, como consecuencia de las ecuaciones
de Maxwell, la velocidad de las perturbaciones electromagnéticas ocasionadas
por electrones acelerados es c en el éter. Con ello Lorentz dedujo el
siguiente resultado:
En sistemas que se mueven con velocidad constante relativa al éter, los
fenómenos electromagnéticos y ópticos son los mismos que en un sistema en
reposo, hasta el primer orden en v/c.
Si a esto se le añade la hipótesis especial de la contracción de la materia
ordinaria, que explica el experimento de Michelson-Morley de segundo orden,
veremos que Lorentz logró explicar todas las pruebas existentes de la teoría
electromagnética. La teoría de Lorentz se convirtió así en la principal
teoría de la electricidad.
Problemas y descubrimientos en la teoría de los electrones
En los dos años que siguieron a la publicación del artículo de Lorentz de
1895, tuvieron lugar dos descubrimientos de gran trascendencia para su
teoría. El primero, en 1896, fue el descubrimiento del "efecto
Zeeman". Zeeman descubrió que una de las líneas luminosas del espectro
de sodio se desdobla en dos cuando el sodio incandescente está en el seno de
un intenso campo magnético. El efecto era muy importante para Lorentz porque
proporcionaba una oportunidad de probar la teoría de los electrones en la
producción real de luz. La modificación del espectro era el primer indicio de
la influencia del electromagnetismo sobre la producción de luz. Dado que,
según la teoría de Lorentz, la causa de las ondas luminosas eran los
electrones vibratorios, debería ser posible derivar los resultados
experimentales a partir de la teoría. Lorentz lo hizo y comprobó que la
precesión del electrón explicaba el desdoblamiento del espectro emitido por
los átomos de sodio. El resultado era especialmente importante porque no sólo
indicaba de forma independiente la existencia de esas pequeñas partículas
cargadas sugeridas por la teoría, sino que daba por primera vez esperanzas de
poder penetrar en los secretos del átomo químico.
J. J. Thomson realizó en 1897 un experimento de mayor trascendencia aún: el
descubrimiento del electrón. Existían a la sazón dos posibles explicaciones
de los "rayos catódicos": una de ellas los consideraba como algún
tipo de perturbación del éter, la otra como diminutas partículas cargadas.
Por otro lado, no hacía mucho tiempo que Jean Perrin había demostrado que el
cátodo emitía rayos negativamente cargados. Se calculó luego la cantidad
mínima de carga asociada con un átomo. Según este resultado, el electrón
resultaba ser unas mil veces más ligero que el átomo de hidrógeno. La
existencia de esta partícula subatómica (que fue un tema polémico durante
varios años) no sólo fue un éxito para la hipótesis de Lorentz de la
existencia de tales partículas en la materia, sino que abrió nuevas
posibilidades al estudio de la estructura del átomo, programa que sería
emprendido por J. J. Thomson y su alumno Rutherford.
A pesar de sus éxitos indudables, la teoría de Lorentz planteaba muchos
problemas. Como en el caso de la teoría de Maxwell, unos eran de carácter
interno, mientras que otros tenían que ver con la aplicación de la teoría.
Entre estos últimos estaba, por ejemplo, el problema de utilizar la teoría de
Lorentz para explicar por qué los cuerpos calientes emiten luz; esto tenía un
gran interés porque prometía proporcionar datos sobre la estructura del
átomo. El trabajo de Planck sobre este problema condujo a la construcción de
la teoría cuántica. Otro problema pendiente de resolver era el de determinar
en qué circunstancias y con qué métodos sería detectable el movimiento a
través del éter. El experimento de Michelson-Morley pedía urgentemente
solución a este problema. La explicación aportada por Lorentz (el
acortamiento de los brazos del aparato de Michelson) necesitaba el marco de
una teoría más general, porque si era correcta, había que buscar una nueva
teoría de las fuerzas moleculares. Como diría Heaviside, el problema no era
tanto la explicación, como la explicación de la explicación.
El segundo problema era reconciliar la teoría de Lorentz con las leyes de la
mecánica de Newton. Lorentz creía que ni siquiera el éter en reposo podía
obedecer las leyes de Newton. Lorentz también rechazaba la acción a
distancia, que era el principio newtoniano clave. Análogamente, y como
consecuencia de los retardos de tiempo que implica la teoría de Maxwell y el
carácter básico de la fuerza magnética, había que rechazar la doctrina de las
fuerzas centrales. Un artículo escrito en 1892 por Helmholtz señalaba que las
tensiones de Maxwell no dejaban al supuesto medio en equilibrio, y que por
tanto, como consecuencia de la desigualdad de tensiones debería haber
movimiento en el éter. Pero Lorentz había establecido como principio que el
éter no se movía en absoluto. Si el éter se moviera en algún punto, tendría
que modificar toda su teoría. La única manera que veía Lorentz de salvar la
teoría de Maxwell y la suya propia era rechazar de plano las tensiones del
éter y las tensiones de Maxwell, y alterar así radicalmente la imagen del
éter.
Estas ideas de Lorentz eran realmente explosivas. El éter se veía desprovisto
de casi todas las propiedades para las que fue inventado, y a la vez se
rechaza una ley fundamental de la teoría newtoniana (la de acción y
reacción). Lorentz había rechazado de plano el concepto de éter como sólido
elástico y como líquido, y en su lugar puso un éter que se limitaba a servir
de sustrato de las fuerzas electromagnéticas, consideradas como magnitudes
fundamentales. Además rechazó la ley de la acción y la reacción para poder
mantener la teoría del electrón por encima de la newtoniana. El propio
Lorentz no estaba contento con el status que había alcanzado su éter, que ni
siquiera se perturbaba al paso de las ondas luminosas. Parecía capaz de actuar
(como sustrato de las fuerzas electromagnéticas), pero no de que se actuara
sobre él. Es decir, estaba en la misma situación que Newton con su
"espacio absoluto". Pero la situación física y filosófica había
evolucionado tanto que el "espacio absoluto" era ya una idea
caduca. Einstein captó perfectamente la difícil situación en que se hallaba
el éter de Lorentz.
La nueva mecánica
El éxito de la teoría de Lorentz provocó una crisis en la mecánica
newtoniana. La crisis, que sólo pudo resolverse abandonando dicha mecánica,
tiene dos vertientes. La primera es que la hipótesis de Lorentz de un éter
inmóvil excluía la posibilidad de explicar los fenómenos electromagnéticos
mediante un éter mecánico subordinado a las leyes de Newton. Por otro lado,
el descubrimiento de Hertz había asestado un golpe mortal a la teoría de la
acción a distancia. Lorentz conservó las partículas eléctricas. ¿Qué mecánica
regía el movimiento de estas partículas? Al igual que en cualquier otra
teoría de partículas eléctricas que explicara la inducción electromagnética
de Faraday, había violaciones del programa de Newton. Así pues, la teoría de
Lorentz implicaba el rechazo de las dos concepciones del mundo, a la vez que
incorporaba los aspectos anti-newtonianos de ambas. Si la teoría de Lorentz
era correcta, se derrumbarían los dos programas de investigación más
ambiciosos en el campo de la electricidad y la mecánica de Newton se vería
amenazada. ¿Qué salida le quedaba a la física en medio de esta profunda
crisis metafísica? Uno de los caminos fue el que hallaron Poincaré y otros:
abandonar la mecánica newtoniana y construir otra nueva basada en la teoría
de Lorentz.
En 1900 se publicó por Poincaré un ensayo titulado "La teoría de Lorentz
y el principio de reacción". Poincaré señala que si la teoría de Lorentz
es correcta, habría que abandonar algunos principios de la mecánica
newtoniana. Advierte que la teoría de Lorentz no sólo viola el principio de
acción y reacción, sino también la conservación del momento entre electrones.
Otro ensayo publicado el mismo año sobre problemas de la mecánica era de W.
Wien: "Posibilidad de una base electromagnética para la mecánica".
Señalaba allí el nuevo programa de investigación: en lugar de tratar de
reducir el electromagnetismo a la mecánica, como hiciera Maxwell, Wien
sugería el proceso contrario, explicar la mecánica de los cuerpos ordinarios
utilizando la teoría electromagnética. No parecía imposible que la materia
estuviera constituida únicamente por partículas cargadas, en cuyo caso la
teoría de Lorentz se erigiría en la teoría de la materia. A la hora de
explicar la mecánica a partir de la teoría electromagnética, la dificultad
mayor que se presentaba era cómo explicar la masa ordinaria. Para este
objetivo, Wien sugería utilizar las investigaciones sobre la masa de los
electrones. La idea era que una partícula cargada en movimiento tiene una
masa efectivamente mayor que su masa en reposo, debido a efectos de
autoinducción. La "masa electromagnética" surge de la siguiente
manera: Cuando una partícula cargada está moviéndose, crea un campo
magnético. Si intentamos acelerar o decelerar la partícula, ésta corta sus
propias líneas de fuerza magnética, con lo cual se crea una fuerza que actúa
sobre la partícula, justamente como si la partícula tuviera una masa mayor, y
esta masa adicional aumenta con la velocidad de la partícula, ya que la
fuerza ejercida sería tanto más intensa. La masa, según la dirección
longitudinal, difiere de la transversal, pues la configuración de las líneas
de fuerza no es la misma en las dos direcciones. Cabe incluso atribuir toda
la masa del electrón a los efectos inductivos.
Max Abraham propugnó la teoría de que toda la masa es electromagnética, e
hizo un primer intento de poner en práctica el programa de reducir la
mecánica a electromagnetismo. Abraham no ignoraba el gran obstáculo que se
oponía a la reducción de toda la física a la teoría electromagnética: el
problema de qué es lo que mantiene unido al electrón. Si el electrón fuera
puramente electromagnético, se disgregaría, ya que sus diferentes partes
tienen cargas del mismo signo y se repelen.
Durante todo este período (1895-1903) Lorentz se preocupó de mejorar su
teoría, publicando una nueva versión en 1904. Reelaboró su teoría como
respuesta, en parte, a las críticas de Poincaré. Poincaré había sugerido
reconstruir la teoría de Lorentz para que fuera consistente con el principio
de relatividad. Esto significaba que la velocidad relativa del éter debía ser
absolutamente indetectable. Y por tanto, el comportamiento de un sistema
dotado de movimiento uniforme sería el mismo que el de un sistema en reposo.
La idea de Poincaré se vio apoyada por dos experimentos realizados
respectivamente por Rayleigh y Brace y por Trouton y Noble en los primeros
años del nuevo siglo.
Las críticas de Poincaré y los experimentos de Rayleigh-Brace y
Trouton-Noble, indujeron a Lorentz a crear una segunda teoría mejorada. Un
aspecto novedoso de la nueva teoría de Lorentz era su nueva expresión para
las masas longitudinal y transversal del electrón en movimiento. Lorentz
había sentado este supuesto de la contracción del electrón por el movimiento
del sistema para garantizar que el resultado del experimento de Michelson
-Morley fuese negativo para cualquier velocidad a través del éter,
independientemente de su magnitud. No parecía seguro el identificar la
velocidad de la tierra a través del éter con la de la tierra en torno al sol.
La única restricción era que el sistema no viajara a velocidades mayores que
la de la luz.
La extensión de su teoría permitió a Lorentz explicar casi todos los
fenómenos de los cuerpos en movimiento, incluidos los experimentos de
Rayleigh-Brace y Trouton-Noble. Había ciertos fenómenos que parecían permitir
la detección de la velocidad del éter, pero Poincaré demostró en 1905 que
estos casos eran precisamente resultado de algunas equivocaciones que había
cometido Lorentz al aplicar sus transformaciones. Demostró, por tanto, que la
teoría de Lorentz era completamente compatible con el principio de
relatividad. Entre tanto el joven Albert Einstein descubrió (1905) un método
mucho más simple para deducir los resultados. Y lo que es más importante aún,
inició un nuevo programa de investigación que conduciría al rechazo explícito
de la concepción newtoniana y al resurgimiento del gran sueño de Faraday: una
teoría del campo unificado. Hasta 1904 fue Lorentz la lumbrera de su época,
siendo el autor de la teoría más general y más completa desde Newton: la
teoría de los electrones. En 1905 la antorcha pasó a Einstein.
La situación problemática de Einstein
El primer artículo de Einstein sobre la relatividad, titulado "Sobre la
electrodinámica de los cuerpos en movimiento" (1905) se sitúa
históricamente en el final de un proceso y el principio de otro nuevo. El
artículo de Einstein inicia una investigación que pondría fin a la mecánica
newtoniana y a la acción a distancia. Completó el derrocamiento de la
concepción newtoniana del mundo que se había iniciado a principios del siglo
XIX y a la vez dio comienzo a una nueva aproximación a la teoría de campos.
Todos los teóricos del campo, desde Descartes hasta Lorentz, concebían el
campo como una sustancia física, algo dotado de propiedades perfectamente
especificables que se conservaban a través de cambios continuos en el espacio
y en el tiempo. Einstein rechazó la sustancialidad del campo y, siguiendo el
principio de la relatividad, trató de construir una nueva teoría de campos.
La construcción de esta teoría de campos supuso la construcción de una nueva
mecánica y de un nuevo tipo de campo. El nuevo concepto de campo nació
fundamentalmente para explicar la gravitación, y está basado en la idea de la
curvatura del espacio. Esta nueva teoría del campo era de alguna forma un
retorno a la idea de Descartes de la materia como sustancia con propiedades
puramente geométricas y un rechazo de los campos de fuerza de Faraday.
A partir de la teoría de Maxwell y la mecánica estadística se puede predecir
la relación entre la temperatura de un cuerpo y la longitud de onda de la luz
emitida cuando se pone incandescente. El problema era que la teoría no
coincidía en general con los resultados experimentales. Max Planck sugirió en
1900 que una solución al problema sería suponer que la luz sólo puede
emitirse o absorberse en ciertos niveles de energía que son múltiples de una
constante muy pequeña "h". La cuestión era: ¿Qué tipo de
modificación haría que la teoría electromagnética fuese compatible con la
teoría de Planck? En 1905 formuló Einstein una sugerencia que iba a ser el
origen de una nueva teoría. Propuso que la luz, desde que se emite hasta que
se absorbe, viaja en paquetes discretos, como si se tratara de partículas. La
hipótesis podría utilizarse para explicar algunas características del efecto
fotoeléctrico; pero, sin menoscabo de su poder explicativo, parecía estar en
contradicción con la teoría de Maxwell en un nivel fundamental. ¿Cómo
reconciliar los cuantos de luz corpusculares con la teoría de Maxwell, donde
la luz era una onda electromagnética? La teoría de Einstein parecía subvertir
la física hasta sus cimientos. Einstein intuía que las viejas teorías no
podían mantenerse por más tiempo, y más que ningún otro se daba cuenta de la
profunda crisis en que se hallaba sumida la física tras las aportaciones de
Lorentz y de Planck. De ahí que Einstein, al buscar la solución al problema
de las leyes electromagnéticas por las que se rigen los cuerpos en
movimiento, explorara nuevos caminos. Había otra razón por la que se hacía
necesario un principio general. Como ya hemos visto en la explicación que Lorentz
dio del experimento de Michelson-Morley, había que introducir fuerzas no
electromagnéticas para explicar los fenómenos: las fuerzas que mantenían
unidas las moléculas y unido el electrón.
Hubo importantes influencias filosóficas en la concepción que se formó
Einstein sobre los problemas de los cuerpos en movimiento: él mismo reconoce
la influencia que ejercieron las ideas vertidas por Ernst Mach en su libro La
ciencia de la mecánica. Dos aspectos de la obra de Mach son aquí pertinentes.
El primero era su disposición crítica hacia Newton, concretamente hacia la
concepción newtoniana del espacio absoluto. Esta postura iconoclasta animó a
Einstein a cuestionar la teoría de Newton y fomentó en él un rechazo del
espacio absoluto de Newton que conservó hasta el final de sus días. La otra
idea que influiría en Einstein fue el requisito de Mach de que todos los
conceptos físicos se definieran en términos "observacionales".
Cuando Einstein enunció el principio de la relatividad, el éter de Lorentz se
halla exactamente en la misma situación que el espacio absoluto de Newton,
por lo cual Einstein buscó una nueva interpretación de la teoría de campos
que rechazara la existencia del éter de Lorentz. Volviendo sobre el viejo
problema del comportamiento de un sistema electromagnético que viaja a la
velocidad de la luz, Einstein descubrió en su principio de relatividad la ley
formal universal con la que intentó construir una nueva mecánica.
La relatividad: el nuevo punto de vista
Einstein se propuso partir del principio de relatividad y deducir las
condiciones a las que tendría que amoldarse la teoría de Lorentz. Tenía muy
claro que las viejas transformaciones de Galileo no servirían, y que hacía
falta algo como las de Lorentz. La razón para esto procedía de consideraciones
del tipo de que una carga en movimiento crea un campo magnético. En un
sistema móvil de cargas habrá líneas de fuerza magnética que influirán sobre
el modo de interacción entre las cargas que se mueven dentro del sistema.
Pero de acuerdo con el principio de relatividad, la interacción de las cargas
de un sistema móvil debe ser la misma que en un sistema en reposo, por lo
cual las transformaciones han de tener la propiedad de suprimir el campo
magnético producido por el movimiento del sistema. Tal objetivo sólo puede
satisfacerse con transformaciones del tipo de las de Lorentz, con sus nuevas
variables de tiempo y distancia. Una transformación galileana no podría nunca
deshacerse del campo magnético.
Einstein no concebía el principio de relatividad a la manera usual. La
concepción más difundida establecía que ningún efecto en un sistema móvil
puede ser producto de su velocidad uniforme relativa al espacio absoluto. O,
extendiendo el principio a la luz y el electromagnetismo, que el movimiento
uniforme relativo al éter de Lorentz no ejerce ningún efecto sobre un sistema
mecánico y electromagnético. La idea de Einstein del principio de relatividad
tenía mayor alcance. Según él, ni el espacio absoluto ni el éter de Lorentz
forman parte de la verdadera imagen del mundo. Para Einstein, el principio de
relatividad era un indicio de la no existencia del éter. Para aplicar el
principio de relatividad a fenómenos ópticos y eléctricos había que suponer
algunas hipótesis adicionales, ya que sin ellas no habría razón para que no
valieran las transformaciones de Galileo. Einstein creía que una hipótesis
mínima que resistiría la prueba del tiempo podría ser la siguiente: "La
luz se propaga siempre por el espacio vacío con una velocidad c que es
independiente del estado de movimiento del cuerpo emisor". El supuesto
de la constancia de la velocidad de la luz en todos los sistemas no es una
consecuencia lógica del principio de la relatividad; es una hipótesis
independiente, y además muy fuerte.
Esta constancia de la velocidad de la luz implicaba tiempos
"diferentes" para un sistema móvil que se aleje o acerque a la onda
luminosa. Atribuir dos tiempos diferentes e igualmente reales a un mismo
suceso era una idea muy radical, que antes de Einstein no se habría ni soñado.
Para dar cuerpo a la idea, Einstein tenía que encontrar algún modo de dar un
significado a esos dos tiempos, de tal suerte que proporcionara predicciones
que se pudieran contrastar experimentalmente. Y por otro lado, el significado
asignado a los dos tiempos (y distancias) tendría que traer como consecuencia
el que la velocidad de la luz medida en los dos sistemas valiera e. ¿Cómo dar
significado experimental a las nuevas ideas sobre el tiempo? Einstein vio que
era necesario reemplazar las longitudes y tiempos absolutos de Newton
(implícitos en el concepto de velocidad relativa al espacio absoluto). Y
tenía que reemplazarlos por unos conceptos de espacio y tiempo que
permitieran tiempos y distancias diferentes en sistemas diferentes. Propuso
reemplazar el tiempo absoluto de Newton por el tiempo señalado por un reloj
(ideal y perfecto, libre de defectos mecánicos). De esa forma, era concebible
que el tiempo señalado en dos sistemas por sus respectivos relojes (en
movimiento relativo) pudiesen ser diferentes. De la misma forma, Einstein
propuso poner la distancia medida por una varilla perfectamente rígida en
lugar de la distancia absoluta ordinaria.
Si se quiere conservar los principios de la relatividad y de la constancia de
la velocidad de la luz, debemos decir que los relojes que son síncronos en un
sistema no lo son según los relojes de otro sistema en movimiento relativo
con el anterior. O bien: sucesos distantes que son simultáneos en un sistema
no lo son en otro que esté en movimiento relativo. La comprensión de la
"relatividad de la simultaneidad" fue para Einstein un paso
crítico. Cayó entonces en la cuenta de que sus dos principios implicaban
efectos que no podían deducirse de las transformaciones de Galileo. Logró
calcular exactamente qué distorsiones del tiempo y del espacio exigían los
principios de relatividad y de constancia de la velocidad de la luz. Estas
transformaciones, deducidas completamente al margen de cualquier hipótesis
sobre el éter y de cualquier teoría electromagnética, proporcionarían las líneas
maestras para una reconstrucción de la mecánica y la teoría electromagnética.
¿En qué se diferencia la concepción del mundo de Einstein de la de sus
predecesores? En mi opinión, la diferencia fundamental es que Einstein niega
la sustancialidad de la materia y del campo, al tiempo que mantiene su
realidad. Tradicionalmente se habían atribuido a la sustancia física las
siguientes características:
1) posición definida y única en el espacio y en el tiempo;
2) ciertas propiedades unívocamente específicas para cada parte de la
sustancia. Las propiedades son esenciales en el sentido de que acompañan
siempre a la sustancia y se conservan frente a todos los cambios de lugar y
de tiempo.
Según muchos filósofos de la ciencia, la búsqueda de causas es en primer
término una búsqueda de aspectos de la naturaleza que se mantienen constantes
frente a cambios aparentes. La noción de sustancia fue el enfoque científico
tradicional para hallar causas de fenómenos físicos. El programa era
encontrar propiedades esenciales de la sustancia física (materia) y reducir
todo cambio y diversidad a la geometría y movimiento de la sustancia. Las
leyes del movimiento devinieron, pues, en las leyes básicas de todo cambio.
El distinguir qué propiedades eran sustanciales había sido tema de discusión
entre metafísicos y científicos. Por ejemplo, Descartes decía que la única
propiedad sustancial era la extensión y Leibniz mantenía en cambio que lo
sustancial era la fuerza. Einstein negó la existencia de sustancia física en
su sentido tradicional. Según Einstein, no se puede asignar de forma unívoca
a una porción de la materia o del campo las propiedades que tradicionalmente
se consideraban sustanciales. Las propiedades toman diferentes valores en
sistemas de referencia distintos, de acuerdo con las transformaciones de
Lorentz y, según la visión del mundo de Einstein, no se puede considerar a
ninguno de ellos como el verdadero. Todos son igualmente reales.
Einstein quería reconstruir la física de manera que formara parte de una sola
teoría del campo unificado y también quería que las leyes y propiedades del
nuevo campo fueran invariantes con respecto a las transformaciones
relativistas. La idea de la invariancia de leyes y propiedades bajo
transformaciones relativistas iba a reemplazar la vieja idea de la identidad
de una sustancia a través de los cambios en el espacio y en el tiempo.
RUSSELL: ABC de la Relatividad.
VI. LA TEORÍA ESPECIAL DE LA RELATIVIDAD
La teoría especial de la relatividad surgió como una explicación de los hechos
del electromagnetismo. Tenemos aquí una historia un tanto curiosa. Durante el
siglo XVIII y principios del XIX, la teoría de la electricidad estaba
totalmente dominada por la analogía newtoniana. Dos cargas eléctricas se
atraen mutuamente si son de polos diferentes, uno positivo y otro negativo,
pero se repelen si son del mismo polo. En cada caso, la fuerza varía en razón
inversa al cuadrado de la distancia, lo mismo que en el caso de la
gravitación.
Se concebía esta fuerza como una acción a distancia, hasta que Faraday,
después de una serie de notables experimentos, demostró el efecto del medio
que intervenía. Faraday no era matemático. Fue Clerk Maxwell el primero que
dio forma matemática a los resultados sugeridos por los experimentos de
Faraday. Además, Clerk Maxwell sentó las bases para considerar que la luz es
un fenómeno electromagnético, que consiste en ondas electromagnéticas. El
medio para transmitir los efectos electromagnéticos podía ser, pues, el éter,
que durante mucho tiempo se había supuesto transmisor de la luz. La exactitud
de la teoría de Maxwell sobre la luz quedó probada por los experimentos de
Hertz en la manufactura de las ondas magnéticas. Tales experimentos aportan
la base para la telegrafía sin hilos. Por el momento, tenemos constancia del
progreso triunfante en el que teoría y experimento asumen alternativamente el
papel rector. En la época de los experimentos de Hertz el éter parecía algo
firmemente establecido y en posición tan fuerte corno la de cualquier otra
hipótesis científica cuya verificación directa no es posible. Pero comenzaron
a descubrirse una serie de hechos, y gradualmente fue cambiado todo el
panorama.
El movimiento que culminó con Hertz era un movimiento para establecer la
continuidad de todas las cosas. El éter era continuo, las ondas dentro de él
eran continuas, y se esperaba que la materia pudiera estar constituida por
una estructura continua en el éter. Pero vino luego el descubrimiento de la
estructura atómica de la materia, y de la estructura discreta de los átomos
mismos. Se creyó que los átomos estaban compuestos de electrones, protones y
neutrones. El electrón es la partícula más pequeña con una carga determinada
de electricidad negativa. El protón lleva una carga de electricidad positiva.
El neutrón, en cambio, no está cargado. (Es tan sólo una cuestión de hábito
llamar negativa a la carga del electrón y positiva a la del protón, pues se
podría afirmar lo contrario.) Parecía probable la imposibilidad de encontrar
la electricidad más que en forma de cargas en el electrón y el protón. Todos
los electrones tienen exactamente la misma carga negativa, igual a la de los
protones, pero la de éstos es positiva y opuesta. Más tarde se descubrieron
las partículas subatómicas; la mayoría de ellas se llaman mesones e hiperones.
Todos los protones tienen exactamente el mismo peso, que es de unas
ochocientas veces el peso de los electrones. Todos los neutrones tienen
también el mismo peso. Son ligeramente más pesados que los electrones. Los
mesones, de los que existen diferentes clases, pesan más que los electrones,
pero menos que los protones. Los hiperones, por el contrario, son más pesados
que los protones y que los neutrones.
Algunas de las partículas llevan carga eléctrica, mientras que otras no la
llevan. Se ha comprobado que todas las de carga positiva tienen exactamente
la misma carga que el protón. Las de carga negativa, en cambio, tienen la
misma carga que el electrón, si bien sus demás propiedades son totalmente
diferentes. Para complicar más las cosas, hay una partícula que es idéntica
al electrón, a excepción de la carga, que es positiva en vez de negativa: se
llama positrón. Un descubrimiento muy reciente es el de una partícula
idéntica al protón, aunque se diferencia por su carga negativa: se la llama
antiprotón.
Estos descubrimientos sobre la estructura discreta de la materia son
inseparables de los hallazgos de otros fenómenos llamados quantum, tales como
las líneas luminosas del espectro de un átomo. Parece que todos los procesos
naturales muestran una discontinuidad fundamental siempre que pueden ser
medidos con suficiente precisión.
De este modo, la física ha tenido que asimilar nuevos hechos y hacer frente a
nuevos problemas. Aunque la teoría cuántica ha existido más o menos en su
forma actual desde hace cuarenta años, y la teoría especial de la relatividad
desde unos sesenta, hasta hace veinte años pocos pasos se dieron para unir a
las dos. Las nuevas interpretaciones de la teoría cuántica la han hecho más
acorde con la relatividad. Tales mejoras han ayudado en gran manera a nuestra
comprensión de las partículas subatómicas, pero todavía quedan muchas y
serias dificultades por resolver.
Los problemas solucionados por la teoría especial de la relatividad en su
propio campo, independientemente de la teoría cuántica, quedan tipificados en
el experimento de Michelson-Morley. Si aceptamos como correcta la teoría del
electromagnetismo de Maxwell, debería haber ciertos efectos del movimiento
detectables por medio del éter. En realidad, no se ha descubierto ninguno.
Estaba también el hecho observado de que un cuerpo en movimiento muy
acelerado parece incrementar su masa. Poco a poco se fueron acumulando hechos
de este género, hasta que se hizo necesario encontrar una teoría que pudiera
englobarlos a todos.
La teoría de Maxwell se reducía a ecuaciones ciertas, conocidas como
"ecuaciones de Maxwell". Éstas permanecieron inalterables a pesar
de las revoluciones operadas en la física a lo largo del siglo pasado. De
hecho, tuvieron cada vez más importancia y mayor certeza; los argumentos de
Maxwell en su favor eran tan débiles que la exactitud de los resultados casi
hay que atribuirla a la intuición. Ahora bien, estas ecuaciones se basaban en
experimentos de laboratorios terrestres; además, existía la suposición tácita
de que podía pasarse por alto el movimiento de la tierra a través del éter.
En ciertos casos, como en el experimento de Michelson-Morley, esto no debiera
haber sido posible sin error comprobable. Pero resultaba que siempre era
posible. Los físicos se enfrentaban a una extraña dificultad: las ecuaciones
de Maxwell resultaban más exactas de lo que en sí deberían ser. Galileo
explicó una dificultad semejante en los primeros albores de la física
moderna. Muchas personas creen que si se suelta un peso, caerá verticalmente.
Pero si se realiza el experimento en el camarote de un barco en movimiento,
el peso cae, en relación al camarote, exactamente igual que si el barco
estuviera parado. Si el peso parte, por ejemplo, de la mitad del techo, caerá
en la mitad del suelo. Es decir, desde el punto de vista de un observador de
la orilla, no cae verticalmente, ya que comparte el movimiento del barco. En
la medida en que el movimiento del barco es estable, todo sucede dentro del
barco como si no se moviera. Ya Galileo explicó esto, con gran indignación de
los discípulos de Aristóteles. En la física ortodoxa derivada de Galileo, un
movimiento uniforme en línea recta no tiene efectos perceptibles. Esto fue en
su día una forma de la relatividad tan asombrosa como la de Einstein lo es
para nosotros. Einstein, en la teoría especial de la relatividad, trató de
demostrar cómo los fenómenos electromagnéticos podían no verse afectados por
el movimiento uniforme a través del éter caso de existir el éter. Éste era el
problema más difícil: que no se podía resolver con sólo acudir a los
principios de Galileo.
El arduo esfuerzo requerido para solucionar este problema estaba relacionado
con el tiempo. Era necesario introducir la noción del tiempo
"propio" que ya hemos considerado y abandonar la vieja creencia de
un único tiempo universal. Las leyes cuantitativas de los fenómenos
electromagnéticos se expresan en las ecuaciones de Maxwell. Y se comprueba
que estas ecuaciones son ciertas para cualquier observador, aun cuando éste
se pueda hallar en movimiento. Es un problema directamente matemático hallar
qué diferencia debe haber entre las medidas aplicadas por un observador o por
otro, si es que, a pesar de su movimiento relativo, han de poder verificar
las mismas ecuaciones. La respuesta la tenemos en la "transformación de
Lorentz", comprobada como fórmula por Lorentz, pero interpretada y hecha
inteligible por Einstein.
La transformación de Lorentz nos dice qué estimación de distancias y períodos
de tiempo habrá de hacer un observador cuyo movimiento relativo es conocido,
si sabemos los de otro observador. Podemos suponer que viajas en un tren en
una línea que se dirige al este. Has estado viajando un tiempo que por los
relojes de la estación de que partiste es t. A una distancia x del punto de
partida, según la gente que viaja en el tren, ocurre un accidente en este
momento; por ejemplo, la destrucción de la línea por un rayo. Has estado
viajando todo el tiempo a una velocidad uniforme v. La pregunta es: ¿a qué
distancia de ti crees que ha tenido lugar este hecho, y cuánto tiempo habrá
pasado por tu reloj, desde que partiste, suponiendo que tu reloj es exacto
desde el punto de vista de un observador que va en el tren?
Nuestra solución de este problema ha de cumplir ciertas condiciones. Ha de
aceptar el resultado de que la velocidad de la luz es la misma para todos los
observadores, aunque puedan estar moviéndose. Ha de aceptar también que los
fenómenos físicos - en particular los del electromagnetismo - obedecen a las
mismas leyes para los mismos observadores, aun cuando puedan comprobar que
sus medidas de distancias y tiempos se ven afectadas por su movimiento. Es
decir, si vas en un tren y tu movimiento afecta a tu apreciación de la
distancia fuera del tren, ha de haber exactamente un cambio similar en la
estimación que personas que están fuera del tren hagan de las distancias
dentro del mismo. Estas condiciones son suficientes para determinar la
solución del problema, pero la solución exige más matemáticas de las que
puedo presentar en este libro.
Antes de presentar el problema en términos generales, pongamos un ejemplo.
supongamos que vas en tren en una línea larga y recta y que te diriges en
dirección este a una velocidad equivalente a las tres quintas partes la de la
luz; mides la longitud del tren y compruebas que es de cien metros.
Supongamos que la gente que te mira al pasar, sirviéndose de métodos titud
científicos de precisión, llegara a hacer con exactitud las observaciones
necesarias para calcular la longitud del tren. Si operan correctamente,
comprobarán que el tren tiene ochenta metros de largo. Todo en el tren les
parecerá más corto si mira en la dirección que sigue el tren de lo que te
parece a ti. Los platos de la comida, que tú ves como platos ordinarios
circulares, parecerán al que está fuera ligeramente ovales: le parecerán
solamente las cuatro quintas partes de ancho vistos tanto en la dirección en
que se mueve el tren como en la dirección de la anchura del mismo. Y todo
esto es recíproco. Imagínate que miras por la ventanilla y ves a un hombre
que lleva una caña de pescar, que, según su medida, es de una longitud de
quince palmos. En seguida podrás ver si la lleva recta. Basta con que te
fijes si forma ángulo recto con los rieles. Pero si está paralela al trazado
del ferrocarril, te parecerá que solamente tiene doce palmos de longitud. Al
describir lo que se ve, he supuesto que todos tienen el debido sentido de la
perspectiva. No obstante, todas las longitudes de los objetos del tren habrá
que disminuirlas en un veinte por ciento, en la dirección del movimiento,
para las personas que están fuera, así como las longitudes de los objetos
exteriores, para ti que estás dentro del tren.
Pero los efectos con respecto al tiempo son todavía más extraños. Eddington
en Space, Time and Gravitation ha expuesto el problema con lucidez casi
ideal. Imagina que un aviador vuela, en relación a la tierra, a una velocidad
de 161.000 millas por segundo y dice:
Si observamos atentamente al aviador deduciremos que es desacostumbradamente
lento en sus movimientos. De modo parecido, los sucesos que durante la
conducción se mueven con él parecerían también retardados como si el tiempo
se hubiera olvidado de seguir adelante. Su cigarro dura dos veces más que uno
de los nuestros. He dicho "deducir" deliberadamente. Veríamos que
el tiempo, de una manera insólita, se hace más lento todavía. Pero esto se
explica fácilmente porque el aviador va aumentando su distancia con respecto
a nosotros y las impresiones de la luz tardan cada vez más en llegarnos. El
retraso más moderado a que he aludido se produce una vez que hemos medido el
tiempo de la transmisión de la luz. Pero una vez más nos volvemos a encontrar
aquí con la reciprocidad, ya que en opinión del aviador somos nosotros los
que volamos a 161.000 millas por segundo. Al hacer la cuenta, comprueba que
somos nosotros los que vamos lentos. Nuestro cigarro dura lo mismo que el
suyo.
¡Qué situación tan envidiable! Cada hombre cree que el cigarro del otro dura
el doble que el suyo. Puede, sin embargo, servir de consuelo el pensar que
las visitas del otro hombre al dentista durarán también el doble.
Esta cuestión del tiempo es bastante complicada, debido al hecho que los
acontecimientos que uno juzga simultáneos, otro los considera separados por
un lapso de tiempo. Para aclarar cómo se ve afectado el tiempo por ello,
volvamos a nuestro tren que se desplaza en línea recta hacia el este a una
velocidad media de las tres quintas partes de la luz. En aras de una mayor
claridad de la ilustración concibo la tierra grande y llana, en vez de
pequeña y redonda.
Si tomamos los hechos que suceden en un punto fijo de la tierra y nos
preguntamos en qué tiempo le parece al viajero que se produjeron desde que se
inició el viaje, la respuesta es que habrá ese retraso de que nos habla
Eddington. En tal caso significa que lo que parece una hora en la vida de una
persona estacionaria, es considerada como hora y cuarto por el hombre que la
observa desde el tren. Recíprocamente, lo que parece una hora en la vida de
la persona que va en el tren es juzgada por el hombre que la observa desde
fuera como una hora y cuarto. Cada uno de ellos forma períodos de tiempo
observados en la vida del otro superiores en un cuarto a lo que en realidad
son para la persona que los está viviendo. La proporción es la misma respecto
al tiempo que respecto a la longitud.
Pero si en lugar de comparar los sucesos en el mismo lugar de la tierra, los
comparamos en lugares muy separados, los resultados son todavía mucho más
sorprendentes. Tomemos ahora los sucesos acontecidos a lo largo del trayecto.
- Desde el punto de vista de la persona que está en tierra suceden en un
momento dado, por ejemplo, el momento en que el observador que va en el tren
pasa ante la persona estacionada. De tales sucesos, los que ocurren en puntos
hacia los que el tren se dirige parecerá al viajero que han sucedido ya. Por
el contrario, aquellos que ocurran en puntos que se encuentran detrás del
tren, serán para él todavía futuros. Cuando digo que los sucesos que acaecen
en la dirección que sigue el tren parecen haber sucedido ya, estoy afirmando
algo no del todo exacto, puesto que todavía no los habrá visto. Pero cuando
los haya visto llegará a la conclusión, después de haber anotado la velocidad
de la luz, de que han debido suceder antes del momento en cuestión. Un hecho
que sucede en la dirección del tren en su recorrido a lo largo del trayecto y
que el observador estacionario juzga que está sucediendo ahora (o mejor,
juzgará que ha sido ahora cuando llega a conocerlo), si ocurre a una
distancia a lo largo de la línea que la luz podría recorrer en un segundo, el
viajero juzgará que ha ocurrido hace tres cuartos de segundo. Si ocurre a una
distancia de los dos observadores que el hombre que está en tierra juzga que
la luz recorrería en un año, el viajero juzgará (cuando se dé cuenta de ello)
que sucedió nueve meses antes del momento en que pasa al habitante de la
tierra. Y de un modo general, adelantará los acontecimientos sucedidos en el
mismo sentido del trayecto en tres cuartos de hora, tiempo que tardaría la
luz desde los sucesos hasta el hombre de la tierra ante el que acaba de pasar
y que juzga que estos hechos están sucediendo ahora. O mejor, afirmará que
sucedían en el momento en que le llega la luz de ellos. Los sucesos que
tienen lugar en la línea férrea detrás del tren habrá que fecharlos con
posterioridad en una proporción exactamente igual.
De este modo tenemos que hacer una doble corrección en la fecha de un
acontecimiento cuando pasamos del observador de tierra al observador viajero.
Debemos tomar las cinco cuartas partes del tiempo tal como las juzga el
habitante de tierra y después restar las tres cuartas partes del tiempo que
tardaría la luz en recorrer desde el hecho en cuestión al habitante de
tierra.
Tomemos cualquier hecho en una parte distante del universo, que sea visible
tanto para quien está en tierra como para el viajero en el momento en que
ambos se cruzan. Si el primero sabe a qué distancia ha ocurrido el suceso,
puede juzgar a qué hora tuvo lugar, puesto que conoce la velocidad de la luz.
Si el hecho ocurrió en la dirección del viajero, éste deducirá que sucedió
hace más del doble de tiempo de lo que cree el hombre que está en tierra.
Pero si ocurrió en la dirección de donde procede, concluirá que sucedió hace
sólo la mitad del tiempo de lo que piensa el hombre que está en tierra. Si el
viajero se mueve a una velocidad diferente, las proporciones serán también
diferentes.
Supongamos ahora que (corno ocurre a veces) aparecen de repente dos nuevas
estrellas y acaban de hacerse visibles al viajero y a nuestro hombre de a pie
a quien está adelantando ahora. imaginemos que una de ellas se halla en la
misma dirección en que se mueve el tren y la otra en dirección contraria, es
decir, de donde el tren procede. Supongamos que el hombre de a pie es capaz,
en alguna forma, de apreciar la distancia de las dos estrellas y de deducir
que la luz de una de ellas, que se mueve en la misma dirección del viajero,
tarda cincuenta años en llegar hasta él, y cien años la otra. Podrá concluir,
pues, que la explosión que originó la nueva estrella en dirección hacia
adelante tuvo lugar hace cincuenta años. En cambio, la explosión que originó
la otra tuvo lugar hace cien años. El viajero no tendrá más que cambiar estas
cifras: deducirá que la explosión ocurrida en la estrella anterior al tren
tuvo lugar hace cien años, y la producida en la parte posterior del mismo
hace cincuenta años. Supongo que ambos discurren correctamente a base de
datos físicos exactos. En realidad, los dos están en lo cierto, a menos que
piensen que el otro debe estar equivocado. Se debería observar que los dos
tendrán la misma apreciación de la velocidad de la luz. Su apreciación de las
distancias de las dos nuevas estrellas variará exactamente en la misma
proporción a su apreciación del tiempo transcurrido desde las explosiones.
Ciertamente, uno de los principales motivos de toda esta teoría es asegurar
que la velocidad de la luz será la misma para todos los observadores, aun
cuando estén en movimiento. Este hecho, establecido por experiencia, era
incompatible con las viejas teorías e hizo absolutamente necesario admitir
algo asombroso. La teoría de la relatividad es tan poco asombrosa como
compatible con los hechos. En realidad, después de algún tiempo, deja de
parecer asombrosa.
Hay otro aspecto de grandísima importancia en la teoría que estamos
estudiando. Y es que, si bien las distancias y los tiempos varían para los
diferentes observadores, podemos deducir de ellos la dimensión llamada
"intervalo", que es el mismo para todos los observadores. El
"intervalo" en la teoría especial de la relatividad se obtiene de
la manera siguiente: se toma el cuadrado de la distancia entre dos sucesos, y
el cuadrado de la distancia recorrido por la luz en el tiempo transcurrido
entre ambos hechos. Se resta el cuadrado menor del cuadrado mayor y el
resultado queda definido como el cuadrado del intervalo entre los dos
sucesos. El intervalo es el mismo para todos los observadores y representa
una relación física genuina entre los dos hechos, cosa que el tiempo y la
distancia no hacen. El intervalo es "temporal" cuando el tiempo
entre dos sucesos es superior a lo que la luz tardaría en recorrer desde el
lugar de un suceso al lugar de otro. En caso contrario, el intervalo es "espacial".
Cuando el tiempo entre dos sucesos es exactamente igual al tiempo que tarda
la luz en recorrer la distancia entre ambos puntos, el intervalo es cero. Los
dos hechos se sitúan, pues, en las partes de un rayo de luz, a no ser que no
pase ninguna luz por ese camino.
Cuando lleguemos a la teoría general de la relatividad tendremos que
generalizar la noción de intervalo. Cuanto más profundamente penetramos en la
estructura del mundo, más importante resulta este concepto. Estamos tentados
a decir que es la realidad la que tiene las distancias y períodos de tiempo
representados confusamente. La teoría de la relatividad ha alterado nuestra
idea de la estructura fundamental del mundo. Es el origen tanto de su
dificultad como de su importancia.
11. La geología en el siglo XIX.
BOWLER, Cap. 6 («La época heroica»).
12. La teoría de la evolución.
ENCICLOPEDIA LAROUSSE
EVOLUCIÓN. (...) El hombre se ha preocupado siempre del origen y pasado de
los seres vivientes. Desde la más remota antigüedad, dos teorías han
intentado explicar la génesis de las especies vegetales y animales: son el
fijismo y el evolucionismo. La idea de la evolución de los seres orgánicos,
de sus transformaciones y divergencias, a partir de un tronco común, se
remonta a la antigua Grecia. Entre sus precursores se pueden citar
Anaximandro de Mileto, Empédocles de Agrigento, padres de la Iglesia (san
Gregorio de Nisa, san Agustín, etc.). Durante el renacimiento, las ideas
evolucionistas de los griegos fueron conocidas. El s. XVII no aportó nada
nuevo a las teorías evolucionistas; pero el s. XVIII, con Buffon y los
enciclopedistas, preparó un clima favorable a la idea de evolución: los
espíritus se liberaron paulatinamente de las fábulas y de las supersticiones
seudocientíficas; los trabajos científicos, especialmente los de sistemática,
condujeron a un mejor conocimiento de la noción de especie. El primer gran
evolucionista fue Buffon, aunque no formuló ninguna teoría evolutiva, quizá
por no atreverse a exponer su pensamiento.
Entre los precursores del s. XVIII destacan Maupertuis, Robinet, Maillet y
Erasmus Darwin, el abuelo de Charles Darwin. Fue Lamarck, discípulo de
Buffon, el primero en formular una teoría evolutiva. La obra de Lamarck causó
una impresión extraordinaria, pero, aún muy alejada de los hechos, suscitó
numerosas críticas, en especial por parte de Cuvier. Éste fue un
antievolucionista; sin embargo, sus trabajos de anatomía comparada, de
sistemática y, sobre todo, de paleontología aportaron sólidos argumentos a la
evolución. Después, Darwin influyó decisivamente sobre las ideas
evolucionistas. En la actualidad no se duda de la evolución: se admite la
continuidad del mundo viviente y la derivación de formas animales y vegetales
unas de otras por filiación.
El hecho de la evolución. Sus pruebas. Las pruebas de la evolución son
numerosas; las principales son:
1.º Pruebas paleontológicas. La paleontología estudia la variación en el
tiempo; en ella se observa la evolución de los seres vivos. Sigue la historia
de la evolución y la filiación de las formas vivas después de centenares de
millones de años. Los diversos tipos de vegetales y de animales aparecen
sucesivamente en el tiempo, según un orden riguroso, que va del más simple al
más complejo. La progresión orgánica es manifiesta: exige una rigurosa
concordancia entre la aparición de un grupo y el lugar que le confiere su
organización; por ejemplo, entre los vertebrados, los agnatos preceden a los
peces, y éstos son anteriores a los reptiles, a los que suceden las aves y
los mamíferos. En los mamíferos, los aplacentados preceden a los
placentarios. La continuidad genética de los tipos sucesivos se afirma por
las formas intermedias que unen dos o más tipos de organización. Estas formas
intermedias presentan una estructura compuesta, con rasgos característicos de
varios tipos, y reciben la denominación de sintéticas. Se conocen, así,
formas intermedias entre peces crosopterigios y anfibios estegocéfalos, entre
anfibios estegocéfalos y anuros. Ciertos terrenos depositados en condiciones
particulares incluyen series continuas de fósiles que muestran la evolución
in situ de erizos (Micraster) o de moluscos (Paludina, Planorbis).
2.º Pruebas embriológicas. La ontogénesis o desarrollo de los individuos
ofrece muchos hechos que no se explican más que con una perspectiva
evolucionista. El corazón del feto humano es un simple tubo curvado que
comprende una aurícula, un ventrículo y un bulbo; esta estructura corresponde
exactamente al corazón de un pez. Los embriones de los amniotas poseen cerca
de la región cervical hendiduras branquiales análogas a las de los peces.
Estas repeticiones son inexplicables si no se admite un origen común a los
organismos que en el curso de su ontogénesis pasan por idénticos
estadios.
3.º Pruebas anatómicas. La embriología muestra qué órganos morfológica y
fisiológicamente distintos en el adulto pueden tener un origen común: son los
órganos homólogos. Además del origen común, presentan relaciones constantes
de situación y de inervación con los órganos vecinos. La vejiga natatoria y
el pulmón son órganos homólogos que provienen de una evaginación del tubo
digestivo anterior. La homologia ha enriquecido la anatomía comparada. El
plan de organización y los órganos homólogos no se comprenden más que en un
aspecto evolutivo. Los órganos rudimentarios están poco desarrollados, no
realizan ninguna función y son homólogos de los normalmente desarrollados en
grupos ancestrales. La carúncula del ojo humano es el resto de la membrana
nictitante, funcional en muchos mamíferos. Existen pruebas de otro tipo, como
las químicas y parasitológicas. Sólo la evolución es capaz de dar una
explicación del mundo orgánico: las estructuras se aproximan unas a otras en
un orden preciso; la aparición de un mamífero está condicionada por la
existencia anterior de los reptiles, cuya organización representa el punto de
partida necesario.
Modalidades de la evolución. La paleontología evidencia algunas reglas
seguidas por el proceso evolutivo: complejidad morfológica creciente; los mamíferos
de organización más elevada se presentan los últimos. La historia evolutiva
de cada gran grupo sigue un mismo proceso, que recuerda el desarrollo de un
individuo; el grupo nace de un modo más o menos explosivo, se extiende, se
diversifica, después reduce su número y, finalmente, se extingue, a menos que
algunas especies subsistan y constituyan las reliquias o fósiles vivientes.
El grupo se inicia siempre por pequeñas especies poco exigentes, denominadas
sintéticas: es la ley de Cope. Después del periodo de expansión, el grupo
pasa a ser estático y cae en decadencia; entonces es sustituido por otro
grupo. Este sucesión de grupos dominantes constituye la ley del relevo,
fenómeno característico de la evolución. La evolución de numerosas líneas
muestra que las variaciones sucesivas tienden a realizar un tipo de
organización cada vez más especializado en un sentido determinado. Las series
evolutivas orientadas son las ortogénesis. Finalmente, la evolución regresiva
es irreversible; es la ley de DoIlo: un órgano desaparecido no reaparece más.
Si aparece un órgano que desempeña el mismo papel que otro desaparecido,
tendrá distinto origen. La evolución es un fenómeno comprobable, pero muy
lento: un tubérculo de un molar de mastodonte necesitaría 660 000 años para
aparecer, y 20 millones de años serían precisos para la realización del molar
completo. Ciertas evoluciones parecen más rápidas que otras. La evolución en
grandes grupos es, al parecer, más rápida cuanto más reciente es el grupo.
Teorías explicativas de la evolución. El hecho de la evolución está
establecido con un rigor suficiente, pero su mecanismo es aún hipotético.
Entre las diversas hipótesis que se han propuesto destacan el lamarckismo o
influencia del medio, el darvinisrno o selección natural, el mutacionisrno y
el neodarvinismo. Las nuevas técnicas de estudio de los cromosomas han
permitido observar ciertos procesos que parecen indicar que las especies
evolucionan como consecuencia de la aparición de cambios consistentes
esencialmente en fusiones centroméricas (o robertsonianas) y, según han
demostrado J. de Grauchy y G. Turleau, en inversiones que incluyen al
centrómero (inversiones pericántricas). Estas alteraciones permiten aislar
grupos de individuos que no pueden reproducirse más que en el interior de
cada uno de dichos grupos, con lo que se consigue un aislamiento reproductor
que da origen a nuevas especies. Una vez que los cambios cromosómicos han
aislado una especie, las mutaciones génicas pueden intervenir para modelarla
y darle su propia personalidad.
ENCYCLOPAEDIA BRITANNICA
El origen de la vida
La mayor parte de las hipótesis sobre el origen de la vida pertenecen a una
de esta cuatro categorías:
1. El origen de la vida es el resultado de un suceso sobrenatural.
2. La vida - especialmente en sus formas más simples - apareció de forma
espontánea y súbita a partir de materia inanimada, tanto actualmente como en
el pasado.
3. La vida es coeterna con la materia y no tiene principio; la vida llegó a
la Tierra cuando ésta se formó o poco tiempo después.
4. La vida apareció sobre la Tierra por una serie de reacciones químicas
progresivas. Tales reacciones serían consecuencia de algunos sucesos químicos
muy poco probables.
En 1850, Pasteur demostró de forma irrebatible que incluso las más pequeñas
criaturas proceden de gérmenes que se hallan flotando en el aire. El químico
sueco Arrhenius mantuvo a finales del siglo XIX la teoría de la panspermia:
microorganismos o esporas flotan por el espacio, yendo de un planeta a otro
por la presión de los rayos solares. Esta teoría sigue sin dar respuesta al
origen de la vida y además se muestra como muy improbable debido a que las
condiciones ambientales del espacio (vacío, frío y radiación) son
extremadamente inadecuadas para la conservación de la vida.
La actitud de Darwin sobre el tema fue: "No tiene sentido preguntarse
por el origen de la vida; es algo así como preguntarse por el origen de la
materia". Curiosamente, en la actualidad se piensa que la postura de
Darwin es acertada puesto que la física actual cree haber solucionado el
problema del origen de los distintos elementos químicos situándolo en las
reacciones termonucleares que tienen lugar en el interior de las estrellas.
La composición de la materia viva es aproximadamente la media entre la composición
del universo y la composición de la Tierra.
En la década de 1920, el británico Haldane y el soviético Oparin tuvieron que
admitir a través de ensayos de laboratorio que la producción de moléculas
orgánicas por otro medio que el biológico en la atmósfera terrestre tal como
es hoy - esto es, con un porcentaje elevado de oxígeno - era algo muy
improbable. A pesar de ello, si la atmósfera terrestre hubiera tenido alguna
vez menor proporción de oxígeno y mayor de hidrógeno, la producción de moléculas
orgánicas hubiera sido mucho más fácil. Si alguna vez, en la Tierra
primitiva, hubieran sido sintetizadas un número grande de moléculas
orgánicas, no habría hoy ningún rastro de ello. La gran cantidad de oxígeno
que hoy existe en la atmósfera terrestre procede en su mayor parte de la
producción fotosintética de las plantas verdes. Además, como Darwin ya había
apuntado, los primeros microorganismos consumirían materia orgánica
prebiológica.
Los experimentos de Oparin y Haldane fueron perfeccionados en la década de
1950 por los americanos Miller y Urey. Hicieron circular una mezcla de
metano, amoníaco, vapor de agua e hidrógeno a través de una solución acuosa
al tiempo que continuamente se producían descargas eléctricas en lo alto del
aparato. Estas chispas representaban los relámpagos que, según se cree, se
producían en las muy frecuentes tormentas eléctricas de la Tierra primitiva.
Al cabo de unos pocos días de funcionamiento, la solución cambiaba de color.
Al analizarla quedaba de manifiesto que varios aminoácidos y otros ácidos con
radical hidroxilo, que actualmente forman parte de la vida, habían sido
producidos. El experimento es tan sencillo y obtiene resultados en tan poco
tiempo que ha sido repetido millares de veces. Si se cambian las descargas eléctricas
por radiación ultravioleta o infrarroja (u otra fuente de energía) también se
forman una gran cantidad de aminoácidos.
Sin embargo, la construcción de polímeros (cadenas largas construidas
mediante la repetición de unidades más simples) ha tenido muy poco éxito
cuando se ha intentado en el laboratorio repitiendo las condiciones de la
Tierra primitiva. La razón está en que el agua impide esta reacción y es
obvio que había mucha agua en aquella época. Se han buscado reacciones que
solventen el problema por medio de catalizadores minerales como la arcilla,
aunque no se ha llegado a ningún resultado definitivo.
HOYLE: La nube de la vida
Darwin, con su teoría de la evolución, logró unificar la biología
construyendo un sistema coherente a partir de un aparente marasmo de hechos.
Las numerosas formas de vida de nuestro planeta son fácilmente separables en
especies, y el número de estas especies es desde luego muy elevado. En el
seno de una especie dada, los organismos que la componen tienen mayor semejanza
entre sí que con los miembros de otra especie distinta, y casi sin excepción,
la reproducción sólo es posible entre individuos de una misma especie. ¿Por
qué las especies difieren unas de las otras? ¿Existe alguna relación entre
los organismos que en la actualidad pueblan la Tierra y los fósiles hallados
en la corteza terrestre? ¿Cómo se modifican las especies como respuesta a los
cambios, tanto climáticos como ecológicos, que se producen en su medio
ambiente? La teoría de la evolución proporciona respuestas adecuadas a estas
preguntas.
Durante su épica singladura en el Beagle la creencia de Darwin en la
evolución se originó fundamentalmente a partir de cuatro grupos de
observaciones:
1) La presencia de especies emparentadas, aunque distintas, en áreas contiguas
de los continentes.
2) Las semejanzas estructurales entre las formas de vida actuales y las
fósiles correspondientes a una misma área.
3) Las semejanzas entre las especies que viven en las islas y las que se
encuentran en los continentes próximos.
4) Las diferencias en cuanto a los tipos de vida y hábitos alimentarios entre
especies que viven en islas muy próximas en el caso del archipiélago de las
Galápagos.
Todos estos hechos pueden explicarse fácilmente si aceptamos que las
distintas especies no han sido creadas individualmente sino que proceden, a
través de continuas modificaciones, de formas ancestrales comunes. Las
mutaciones se producen al azar, pero la selección natural tiende a perpetuar
aquellas mutaciones que confieren una mejor capacidad de supervivencia o de
reproducción a sus poseedores. Las condiciones ecológicas del medio, en un
momento dado, proporcionan los elementos discriminantes para seleccionar a
aquellas mutaciones que son ventajosas para la supervivencia frente a las que
no lo son. De este modo, todos los organismos vivos están adaptados a los
varios tipos de vida y cada organismo se adapta a las peculiares
características de su particular posición ecológica. El propio Darwin no
probó la existencia de la evolución. Se limitó a afirmar que con la evolución
es posible dar explicación a numerosos hechos empíricos que de otra forma es
difícil comprender.
Hay evidencia de que la evolución de la vida en la Tierra se ha prolongado,
al menos, durante tres mil millones de años, y que todavía hoy continúa. Se
han hallado registros fósiles antiguos en rocas sedimentarias, es decir, en
rocas que se han formado en el fondo de los lagos o del océano. Los depósitos
sedimentarios se forman continuamente por alteración de las rocas que están expuestas
al aire y a la humedad, proceso que conduce a la fragmentación de los
materiales superficiales de la corteza terrestre. A continuación el aire y el
viento se encargan de transportar los fragmentos a niveles inferiores
situados en el fondo de los lagos y océanos. Los depósitos sedimentarios
incluyen también productos procedentes de la actividad biológica,
consistentes en compuestos bioquímicos producidos por los organismos vivos, y
en fósiles microscópicos y macroscópicos. Todos estos materiales son
depositados y comprimidos hasta formar capas estratificadas de rocas en un
proceso que dura largos períodos de tiempo geológico.
Las rocas sedimentarlas constituyen una capa relativamente delgada en la
superficie terrestre ya que su grosor es por término medio de 2,5 km. Esta
capa muestra un gradiente de la composición y contiene importante información
acerca de nuestro pasado. Poco después de la solidificación de la corteza
terrestre (hace aproximadamente cuatro mil quinientos millones de años) se
puso en marcha el proceso de erosión por parte del agua y del aire, y se
inició también el proceso de sedimentación. Es posible datar cada capa
mediante el empleo de varias técnicas según distintos tipos de radiactividad.
Los depósitos sedimentarios más antiguos se han localizado cerca de la
frontera de Swaziland, en el Transvaal central. La zona de Barberton Mountain
abarca unos centenares de kilómetros cuadrados de terrenos geológicos
extremadamente importantes, incluyendo las rocas de Onverwacht, depositadas hace
aproximadamente mil setecientos millones de años.
La figura 1 presenta una secuencia de los acontecimientos cósmicos y de la
evolución de la vida en la Tierra. La evidencia más antigua de un organismo
vivo se remonta a unos tres mil cien millones de años, en la Fig Tree Chert,
que es una roca oscura del tipo del pedernal perteneciente al sistema de Fig
Tree, también en la zona de Barberton Mountain. Estas trazas, al ser
observadas en micrografías electrónicas, presentan una serie de formas
estructurales parecidas a las actuales colonias de bacterias. Si estas
estructuras son realmente restos de primitivas bacterias, la conclusión es
que hace tres mil cien millones de años existían ya sistemas metabólicos
complejos. Dichas identificaciones estructurales, que fueron iniciadas por
vez primera por C. D. Walcott en 1883, han sido confirmadas recientemente a
través de la aportación de estudios mucho más sutiles. Si las estructuras
observadas con el microscopio electrónico corresponden realmente a fósiles biológicos,
es importante la investigación de las cantidades presentes de determinados
compuestos bioquímicos asociados con estas estructuras. En varios casos estos
compuestos han sido descubiertos.
El registro fósil más reciente, aproximadamente de seiscientos millones de
años de antigüedad, se encuentra bien documentado. En este período aparecen
los primeros indicios de organismos con estructuras densas (conchas duras y
esqueletos óseos). La interpretación de los cambios evolutivos se hace
entonces más directa. Sin embargo, la tesis de que la evolución darwiniana
podría explicar la gran multiplicidad de especies que queda reflejada en el
registro paleontológico carece de una fundamentación sólida. La gran
actividad evolutiva que se produce después del período geológico del Cretáceo
es difícil de justificar con la teoría darwiniana en su planteamiento más
común. Requeriría que la selección natural operara contra un incremento de
información genética promediada en aproximadamente un gen cada mil años.
(...)
Los primeros primates surgieron en la Tierra en un momento todavía mal
definido pero que hay que situar hace unos sesenta y cinco millones de años.
Por lo tanto, el predominio de nuestros antepasados inmediatos sobre las
distintas formas vivientes presentes en el planeta se limita a una proporción
muy pequeña de toda la existencia de la corteza terrestre. La primera prueba
tangible de la existencia de una forma viviente terrestre se remonta a unos
tres mil cien millones de años en la Fig Tree Chert. Sin embargo, es probable
que este indicio localizado no constituya el origen más remoto. La evolución
de las primitivas formas vivas a partir de material prebiótico debió tener
lugar en un período situado entre cuatro mil quinientos y tres mil cien
millones de años atrás.
La evolución se enmarca sobre una escala de épocas geológicas. Sin embargo,
la evolución biológica es un proceso continuo inexorable, e incluso en los
primeros veinte años de las observaciones originales de Darwin, se dispuso de
pruebas acerca de la evolución manifiesta en determinadas especies. En
experimentos mucho más recientes, los científicos han logrado mutaciones en
cepas bacterianas en lapsos de tiempo mucho más reducidos. Sin embargo,
aunque las premisas de Darwin han sido muy valiosas en la investigación del
origen de la vida, es necesario considerar aspectos de la vida, de la materia
y de la evolución que este autor no trató directamente. (...)
13. La ciencia en el siglo XX.
SOLO EN CASA
La segunda revolución científica: crecimiento exponencial de la ciencia a
partir de mediados del XIX que se divorcia del sentido común cotidiano y
amenaza desbordar la vida cotidiana con la tecnología. El temario se reduce a
las ciencias físico químicas y biológicas.
El liderazgo científico ha ido pasando progresivamente a Alemania durante el
XIX por su industria de transformación (frente a la USA que era básicamente
ensambladora: taylorismo) y por su sistema educativo avanzado
(intervencionismo estatal). Las voces que pedían en Gran Bretaña un mayor apoyo
estatal a la ciencia fueron desoídas. En USA se fundan dos importantes
instituciones privadas: el MIT y la Johns Hopkins. Florecen las instituciones
y congresos científicos internacionales a partir de 1800, aunque la ciencia
continua conectando con los intereses de cada país.
La investigación ya no es la ocupación de individuos aislados con pocos
recursos: la ciencia se hace necesaria para generar aplicaciones
industriales: motor eléctrico, radio, telefonía, etc.
Al finalizar la 1ª guerra mundial es patente el uso de la ciencia en
aplicaciones militares (gases venenosos) y se aísla a los científicos
alemanes hasta que Hitler provoca un éxodo masivo de científicos hacia USA y
GB.
Durante la 2ª guerra la colaboración de los científicos será decisiva (proyecto
Manhattan = bomba atómica). Crisis de conciencia de los científicos y quiebra
de la imagen idealizada de la ciencia. La política de bloques subsiguiente
acentuará el proceso.
MASON, Vol. 5, Cap. 5 («La ciencia y los movimientos
nacionales en Italia y Alemania»)
MASON, Vol. 5, Cap. 6 («Algunos aspectos de la ciencia
americana y soviética»).
14. La mecánica cuántica.
DELIGEORGES, El mundo cuántico.
De Chevalley, C.: "Una nueva ciencia":
La diferencia entre la teoría clásica y la mecánica de los quanta, dicen Born
y Heisenberg, radica en la "existencia de discontinuidades". El
"postulado de los quanta" es un postulado de existencia de
cantidades discretas. Como ejemplo de estas discontinuidades constitutivas de
la mecánica cuántica, Born y Heisenberg citan, por un lado, los
"corpúsculos" (electrones y quanta de luz), y por otro los
"estados estacionarios separados" (determinados valores de la
energía, valores de impulso): esta característica hace de la nueva teoría la
prolongación directa de los trabajos de Planck, Einstein y Bohr desde 1900.
Por otra parte, lleva a proporcionar a la física del átomo un "elemento
estadístico esencial, (...) el aspecto de un experimento que en general no
puede deducirse de las condiciones iniciales si no es de manera
estadística".
Los cálculos se realizan sobre valores medios, ya que casi todas las
observaciones en física atómica son de carácter estadístico, la teoría no
puede predecir un suceso aislado. Se trata de una "impotencia esencial
profundamente anclada en nuestra posibilidad de conocer los fenómenos
físicos", que nos lleva a reconocer que el determinismo hasta entonces
admitido como base "de las ciencias exactas de la Naturaleza" no
puede ya aceptarse sin discusión y que existe una indeterminación fundamental
de las fórmulas de la mecánica de los quanta. Indeterminación no quiere decir
imprecisión: cada magnitud característica de los fenómenos atómicos tomada
por separado puede ser medida y definida con tanta precisión como se quiera,
al igual que en la teoría clásica; pero si se quiere medir simultáneamente
magnitudes unidas canónicamente (es decir, en términos del cálculo de
operadores, magnitudes cuyos operadores no son permutables), entonces resulta
imposible descender por debajo de cierto límite. El hecho de que este límite
venga dado por una relación que hace intervenir la constante h de Planck (el
producto de los errores medios sobre dos magnitudes unidas canónicamente es
siempre superior o igual a h) aclara al mismo tiempo el verdadero sentido de
éste: la constante de Planck es la "medida universal de la
indeterminación introducida en las leyes naturales por el dualismo de las
ondas y de corpúsculos".
La diferencia entre la mecánica clásica y la mecánica cuántica emana
directamente del principio de indeterminación. Efectivamente, en mecánica
clásica no se hace uso de este principio y se admite la posibilidad de
determinar el estado inicial con total precisión (incluso si como ocurre con
frecuencia esto no es de hecho posible). En mecánica cuántica estamos
limitados por la circunstancia de la indeterminación a poder determinar
solamente la variación de las funciones de probabilidad, que se modifican en
cada nueva experiencia. A esta teoría física presentada como intuitiva y
completa aun cuando renuncia a la visión tradicional de la mecánica y aun
cuando postula una indeterminación fundamental del conocimiento de los
procesos atómicos, la exposición de Bohr le va a dar la dimensión de una
interpretación filosófica general.
La teoría de la complementariedad es elaborada por Bohr a lo largo. de 1927.
Es una formulación general del problema de la representación de los fenómenos
tal como obligan a hacerla los resultados de la nueva mecánica. En primer
lugar, dice Bohr, es necesario renunciar al empleo simultáneo de conceptos y
modos de representación clásicos: espacio, tiempo y causalidad. En teoría
clásica, la representación espacio-temporal de los fenómenos (partículas
identificadas con puntos matemáticos u ondas electromagnéticas) se combina
con un principio de causalidad (determinación completa del estado inicial de
un sistema y predicción de su estado futuro) para proporcionar una
representación completa. En teoría cuántica, tenemos que contentarnos con
usar alternativamente una u otra forma de descripción. La complementariedad
es presentada por Bohr siempre como una relación de "exclusión
mutua" y de disyunción en la representación. Hay que reconsiderar los
propios conceptos, hasta ahora tan claros, de observación, fenómeno,
posibilidades de definición, medida, etc. Lo propio de la teoría cuántica es
declarar caduca la idea clásica de que un "objeto" existe
independientemente de que se le observe; se introduce en el concepto de
observación una cierta arbitrariedad, debida a la decisión de situar aquí o allá
la demarcación teórica entre lo que es observado y lo que se utiliza para
observar. Por esta razón conviene seguir la dirección ya indicada por
Einstein de la relatividad y "adaptar nuestras formas de intuición,
tomadas de nuestras impresiones sensoriales, al conocimiento cada vez más
profundo de las leyes de la Naturaleza". Esta transformación del
significado asignado a lo que es susceptible de ser "visto" es
tarea de la teoría de la complementariedad.
De Paty, M.: "Einstein en la tempestad":
Los protagonistas de la escuela de Copenhague, seguros tras el éxito de la
nueva teoría, pensaban que la clave de la irreductibilidad de los fenómenos
cuánticos a los anteriores conceptos clásicos residía en un nuevo concepto
del conocimiento y de la teoría física. Según este concepto, resulta ilusorio
hablar de un sistema-objeto independientemente de la trayectoria seguida para
la observación de ese sistema: la medida (en el sentido de referencia
fundamental) de todo conocimiento y de toda teoría, es la observación.
Retomando una formulación de Heisenberg, la física no se interesa por los
objetos reales, sino por el binomio inseparable sujeto-objeto, y no habla
nunca de la Naturaleza, sino de nuestra forma de aprehender. Einstein no deja
de protestar contra esta filosofía de la observación. Para los físicos de la
escuela de Copenhague, la mecánica cuántica obliga a una filosofía del
conocimiento que renuncie al determinismo, a la objetividad, incluso al
principio de realidad. Para Einstein, si la teoría fracasa en caracterizar de
manera precisa los elementos de la realidad, es que es incompleta. Hasta su
muerte, Einstein luchó contra las pretensiones de la mecánica cuántica, tal
como se presentaba por lo general, de avalar un concepto tan abiertamente
opuesto a lo que él siempre había pensado. Sus críticas encontraron en Bohr
un interlocutor de su talla y la confrontación suscitada entre ellos bien
merece el apelativo de "debate del siglo". Lejos de ser una estéril
polémica, contribuyó enormemente a precisar las "interpretaciones"
de la mecánica cuántica, y a hacer explícitas ciertas propiedades que no se
habían percibido claramente. Entre ellas (y quizá la más importante de todas,
pues constituye una especie de resumen de las propiedades de los sistemas cuánticos
en lo que tienen de irreductibles a las representaciones clásicas), se
encuentra la inseparabilidad, apartada de la discusión del "argumento
EPR" entre Einstein, Podolski y Rosen por un lado, y Bohr por otro.
De Wheaton, B.R.: "El duque en la mecánica ondulatoria":
En 1921, Louis de Broglie examina estas cuestiones, y descubre una nueva
paradoja que reúne dos de los principales descubrimientos de Einstein, el
quantum luminoso y la teoría de la relatividad. La dilatación relativista del
tiempo predice que un observador fijo mide una frecuencia más baja para un
oscilador móvil que para el mismo oscilador inmóvil. Sin embargo, la teoría
cuántica predice el efecto inverso. La aportación más importante de Louis de
Broglie a la física fue comprender que la resolución de esta asimetría
cuántica relativista aclararía el carácter paradójico de las representaciones
corpusculares y ondulatorias de la radiación.
De Broglie encontró exactamente la condición matemática de estabilidad de las
órbitas del átomo de Bohr. Descubrió lo que se le había escapado a Bohr: una
explicación física de la existencia de órbitas electrónicas discretas que
aquél se había contentado en plantear como hipótesis. Einstein dirá entonces:
"Ha levantado un extremo del gran velo". Louis de Broglie había
cerrado el círculo de la analogía entre luz y materia propuesta por Einstein.
Las propiedades ondulatorias de la luz y las corpusculares de la materia
estaban bien establecidas. El quantum luminoso de Einstein introdujo las
propiedades corpusculares para la luz. La hipótesis de Louis de Broglie
predijo las propiedades ondulatorias para la materia. Había como una última
permutación entre onda y partícula, igual que para la materia y la radiación.
Del mismo modo que en el siglo XIX la teoría de Maxwell había descubierto una
simetría de las teorías de la luz, la electricidad y el magnetismo,
agrupándolas, así también Einstein y De Broglie dieron a la materia y a la
luz posiciones simétricas en la teoría física. Según la mecánica cuántica
ondulatoria, cada una de las dos presenta propiedades a vez corpusculares y
ondulatorias, que se hacen mas o menos visibles unas sobre otras dependiendo
de las condiciones experimentales.
De Darrigol, O. : "Relatividad y mecánica cuántica:
un matrimonio delicado":
Louis de Broglie, en una síntesis genial de las dos célebres fórmulas de
Einstein E = m c2 (relatividad) y E = h U (teoría cuántica), asoció una onda
de frecuencia U a toda partícula de masa m y abrió así la vía de la mecánica
ondulatoria. Pero a pesar del hallazgo de de Broglie, la relatividad no fue
tomada en cuenta por la mecánica ondulatoria de Schrödinger ni tampoco
por la mecánica matricial de Heisenberg.
El trabajo de Heisenberg supuso para Paul Dirac una revelación: tenía que
existir una profunda analogía formal entre la nueva mecánica cuántica y la
mecánica clásica. Es decir, las ecuaciones debían ser las mismas, excepto que
las posiciones y velocidades de los objetos ya no eran números ordinarios.
Esto suponía captar la esencia del enfoque de Heisenberg mejor que el propio
Heisenberg. Sin ninguna hipótesis adicional, dedujo los tres procesos
fundamentales de interacción átomo-radiación, en la línea de lo aventurado
por Einstein en 1916:
Emisión espontánea: un átomo excitado aislado emite un cuanto luminoso en el
vacío libre de radiación.
Absorción: un átomo absorbe un cuanto luminoso.
Emisión inducida: un átomo emite un cuanto luminoso bajo el efecto de cuantos
idénticos ya existentes en el campo.
A pesar de su alto grado de abstracción, la ecuación de Dirac fue
inmediatamente considerada como la "verdadera" generalización
relativista de la ecuación de Schrödinger. Ahora era posible construir una
teoría cuántica relativista de la interacción entre radiación y partículas
cargadas. Se le dio el nombre de electrodinámica cuántica. Esta labor les
costó a Jordan , Heisenberg y Pauli más de dos años realizarla debido a su
gran dificultad matemática. Siguiendo la idea de Jordan, tanto la materia
como la radiación habían de ser representadas por ondas cuantificadas en el
espacio-tiempo: las partículas de materia (electrones, protones) debían ser
los cuanta del campo de Dirac, solución de la ecuación de onda de Dirac @,
del mismo modo que los fotones eran los cuanta del campo electromagnético,
solución de las ecuaciones de Maxwell.
Guiados por la analogía existente entre materia y radiación, tan querida para
Einsten y de Broglie, Jordan, Klein y Wigner dieron a sus ondas de materia
cuantificadas una expresión formal lo suficientemente general para poder describir
las partículas elementales entonces conocidas, que eran los protones y los
electrones.
Apenas se conocieron estos grandes éxitos teóricos en la fusión de los
principios cuánticos y relativistas, dos grandes dificultades vinieron a
poner en apuros a la teoría. En primer lugar la ecuación de Dirac implicaba
que la materia con carga sería fundamentalmente inestable. Este problema fue
resuelto dos años después por el mismo Dirac. En esta solución le apareció la
posibilidad de la existencia de un electrón con carga positiva. Cuatro años
más tarde, en 1933, el positrón fue descubierto. La otra dificultad tardó
veinte años en ser solucionada. Cuando se buscaban cantidades finitas
medibles (por ejemplo la probabilidad de colisión de dos partículas) aplicando
las reglas de la electrodinámica cuántica, se hallaban cantidades infinitas.
Weisskopf, Feynman y otros encontraron en 1948 la manera de remediar estos
infinitos mediante lo que se llamó la renormalización.
De Messiah, A. : "Descenso al corazón de la materia":
En el marco clásico de la teoría electromagnética de Maxwell, el campo
electromagnético es una onda continua. No se podían explicar los espectros
atómicos dentro del marco de la física clásica. Era necesario encontrar un
nuevo marco: la mecánica cuántica. En su contexto se pudo comprender la
física atómica; la etapa siguiente fue comprender la naturaleza y composición
de los núcleos atómicos, que son unas 10.000 veces más pequeños que los
átomos.
La cuantificación es un fenómeno totalmente general que concierne tanto a la
radiación electromagnética como a la materia. La dualidad onda-corpúsculo, la
existencia del fotón, no tienen cabida dentro del marco de la teoría de
Maxwell.
La interacción entre una fuente del campo electromagnético y otra fuente del
mismo campo se realiza a través de partículas que son los cuantos de ese
campo. Si se quiere conocer la física a escala microscópica, hay que explorar
con longitudes de onda cada vez más pequeñas. Este es el primer argumento que
proviene de la teoría cuántica. Dentro de esta teoría, las longitudes de onda
pequeñas corresponden a grandes transmisiones de impulso. Hubo que admitir
finalmente que los nucleones son objetos compuestos, formados por unos
elementos denominados quarks. La interacción entre quarks es la contraria de
la interacción electromagnética. En la interacción entre quarks, cuanto más
nos alejamos, más fuerte se hace la fuerza de atracción. Es lo que se
denomina confinamiento.
De Castiel, A. : "La virtud de la desigualdad":
En 1935, junto con sus dos colaboradores Podolsky y Rosen, Einstein, en el
curso de su controversia con los físicos de la escuela de Copenhague sobre el
significado de la teoría cuántica, desarrolla una argumentación incisiva que
se hizo célebre bajo el nombre de "paradoja EPR". En ella defiende
su visión determinista de un mundo real que existe fuera del observador.
Einstein no pretendía en modo alguno que la mecánica cuántica fuese errónea,
sino solamente incompleta. suponía que tenía que haber una explicación más perfecta
de los fenómenos: es lo que más tarde se llamó hipótesis de las variables
ocultas.
John Bell, por medio de su famoso teorema de la desigualdad (año 1964), fue
el primero en demostrar que estar de acuerdo con Einstein o con Bohr no era
una simple cuestión de convicción filosófica. La esperanza de completar la
mecánica cuántica se desvanece con las desigualdades de Bell. La confirmación
experimental del teorema de Bell, en especial los trabajos de A. Aspect,
muestran que la hipótesis de separabilidad (en la que se fundaba la paradoja
EPR) es insostenible.
De Aspect, A. : "En la criba de la
experiencia":
En su artículo de 1935, Einstein, junto con Poldosky y Rosen, construyó sus
"experimentos mentales" (paradoja EPR) que probaban que la mecánica
cuántica tenía contradicciones internas. Su razonamiento se basaba en tres
hipótesis:
- Las predicciones de la mecánica cuántica son acertadas.
- Ninguna señal - ninguna interacción - puede propagarse más de prisa que la
velocidad de la luz.
- Cuando dos objetos (p.ej. dos fotones) se alejan el uno del otro, se puede
hablar separadamente de dos elementos de la realidad física (hipótesis de
separabilidad).
En el razonamiento EPR, Einstein aplica este conjunto de hipótesis a dos
partículas alejadas entre sí pero que interactuaron en el pasado. Las
paradojas que aparecen muestran, según él, el carácter incompleto de la
mecánica cuántica.
La contribución de Bell demuestra que las hipótesis del razonamiento EPR son
contradictorias. La hipótesis de separabilidad es incompatible con las
predicciones cuánticas. Desde entonces sabemos que no podemos
"comprender" las predicciones de la mecánica cuántica en la
situación EPR con una imagen "razonable".
De d’Espagnat, B. : "La no-separabilidad o la
realidad incomprensible":
La física clásica estaba concebida como una teoría realista y separable:
- Realista porque era plenamente compatible con una realidad
"exterior", la cual, al menos parcialmente, era cognoscible.
- Separable porque se podía separar la realidad en elementos distintos y
localizados susceptibles de interactuar entre sí.
Lo que han aportado el teorema de Bell y su posterior confirmación
experimental es la idea de que la afirmación "realismo y separabilidad
son verdaderos" es una idea irreconciliable no ya con un a priori
epistemológico, sino, simplemente, con los hechos. La física de las
apariencias sustituye a la realidad incomprensible. Bajo las
"apariencias" idénticas para todos los hombres (y, por tanto,
"objetivas"), la incomprensible realidad a lo sumo se deja
adivinar.
De Lalöe, F. : "La mecánica cuántica":
En mecánica clásica, la descripción del estado físico de un cuerpo material
comprende su posición en el espacio, su velocidad, etc., magnitudes que son,
aparentemente, muy concretas. En mecánica cuántica todo esto se sustituye por
un ente matemático complejo, el "vector de estado", designado por
@. Las relaciones matemáticas entre @ y lo que se puede medir del sistema son
no-lineales.
Inicialmente, Schrödinger pensaba que @ daba una descripción directa de la
realidad. En el otro extremo había quien consideraba que @ no daba una
descripción del sistema sino sólo de los datos disponibles acerca del mismo.
Ninguna de estas dos interpretaciones - la objetiva o la subjetiva - ha
resultado ser satisfactoria. Desde el punto de vista de la mecánica cuántica
denominado "escuela de Copenhague" (Bohr, Heisenberg), que es el
que actualmente se considera "ortodoxo", @ se encuentra en un lugar
intermedio: ni completamente objetivo ni completamente subjetivo, lo que en
principio ya no es fácil de entender. Para mayor complicación, la evolución
de @ no viene dada por un postulado único sino por dos clases de postulados
completamente distintos, uno determinista y causal (ecuación de Schrödinger)
y otro indeterminista y no causal (cuando se hace una medición, @ evoluciona
de modo imprevisible). El vector de estado @ es un ente matemático que no
tiene similar en ningún dominio de la física.
De Lèvy-Leblond, J.M. : "La cuántica a gran
escala":
La teoría cuántica subtiende toda nuestra comprensión de la materia, de la
escala más pequeña a la más grande. Si la materia ordinaria puede ser
descrita en términos clásicos de manera aproximada, su existencia misma sólo
se comprenderá en términos cuánticos. En teoría cuántica la identidad de los
cuantones (partículas cuánticas: electrones, fotones...) conlleva una
verdadera pérdida de identidad para los objetos considerados individualmente.
En teoría cuántica ocurre que el concepto de trayectoria y el de localización
espacial ha de ser modificado: ya no es posible, en un conjunto de cuantones,
seguirlos individualmente y definir sus destinos particulares. No hay más
remedio que considerar el sistema de forma colectiva.
Los principios de la teoría cuántica demuestran que existen dos tipos de
cuantones:
- Los fermiones que obedecen al principio de exclusión de Pauli, el cual dice
que dos fermiones idénticos no pueden encontrarse en un mismo estado físico.
Así, un estado colectivo se construirá a partir de estados individuales
diferentes. Los electrones y los nucleones son fermiones. Se rigen por la
estadística de Fermi-Dirac.
- Los bosones que obedecen a un principio de gregarismo (no siguen el
principio de exclusión de Pauli) observando una clara preferencia por los
estados colectivos. Los fotones y mesones son bosones. Se rigen por la
estadística de Bose-Einstein.
En general, en un sistema de fermiones sucederá como si el carácter exclusivo
de sus constituyentes indujera entre ellos una repulsión; a la inversa, un
sistema de bosones mostrará un tipo de atracción recíproca que dará al
sistema una coherencia de conjunto.
GRIBBIN, JOHN, En busca del gato de Schroedinger
El cuerpo negro: es un perfecto absorbente de radiación. La temperatura del
cuerpo negro desplaza el espectro. La teoría clásica afirma que la energía
radiada en cada frecuencia es proporcional a dicha frecuencia. La frecuencia
es inversamente proporcional a la longitud de onda. Por lo que deberían
producirse grandes cantidades de energía en la zona ultravioleta: Catástrofe
ultravioleta.
Ley de Rayleigh-Jeans: ajusta muy bien las observaciones con las predicciones
en la zona de baja frecuencia.
Ley de Wien: predice la longitud de onda a la que aparece el máximo a
cualquier temperatura.
Planck (1900): combina ambas leyes en una fórmula que carece de supuestos
físicos. (E = h n). Las partículas sólo pueden radiar (o absorber) energía
(E) en porciones de un cierto tamaño (quantos) que está relacionado con la
frecuencia (n) y una nueva constante (h: constante de Planck = 6,55 * 10-27
ergios*segundos. Medida por Millikan en 1914).
Einstein (1905): aplica la ecuación a las radiaciones electromagnéticas. La
luz no es una onda continua, sino que está integrada por paquetes bien
definidos (fotones).
Bohr (1913): describe la estructura del átomo como un sistema solar en
miniatura (núcleo y corteza) con electrones moviéndose en órbitas estables.
Un cambio de órbita implica la absorción o emisión de un quanto de energía.
Lo demuestra dando una explicación del espectro (rayas oscuras) de la luz del
átomo de hidrógeno (la fórmula de Balmer de 1885).
Einstein (1916): introduce la noción de probabilidad en la teoría atómica
(rechazada por él mismo posteriormente: "Dios no juega a los
dados").
Bohr (1922): explica las capas de electrones como diferentes niveles de
energía y en cada capa sólo cabe un número determinado de electrones (2s, 8c,
etc.). Las combinaciones químicas se explican como la manera de completar la
capa más externa.
De Broglie (1923): descubre la relación subyacente entre las teorías
corpuscular y ondulatoria. La total ruptura con la física clásica se produce
al tomar conciencia de que no sólo los fotones y los electrones, sino todas
las partículas y todas las ondas son, de hecho, una mezcla de onda y
corpúsculo.
Pauli (1925): formula el Principio de Exclusión para explicar por qué cada
capa debe tener un número máximo de electrones. No pueden existir electrones
que tengan los mismos cuatro números cuánticos (momento angular, figura de la
órbita, orientación y espín).
Fermi/Dirac, Bose/Einstein (1926): dos tipos de partículas: fermiones (espín
semientero) y bosones (espín entero).
Heisenberg/Jordan/Born (1925): introducción de la matemática matricial (no
conmutativa) que contiene la mecánica clásica. Los trabajos de Dirac en este
sentido son fundamentales (y mucho más elegantes). El tablero de ajedrez
(coordenadas). Dirac demuestra que las ecuaciones matriciales son
equivalentes a las ecuaciones ondulatorias de Schrodinger.
Heisenberg (1926): Principio de indeterminación: no es posible conocer la
posición y el momento de una partícula simultáneamente. Otra cara de la
dualidad onda (momento) / corpúsculo (posición). "no podemos conocer,
por principio, el presente en todos sus detalles".
Bohr (1927): La interpretación de Copenhage: primera visión de conjunto de la
teoría cuántica en la conferencia de Como. Idea de la complementariedad entre
los aspectos ondulatorio y corpuscular; la simetría esencial.
Anderson/Hess (1932): en sus estudios de los rayos cósmicos descubren el
positrón. Ello abrirá el campo al estudio de muchas otras partículas
(actualmente se conocen unas 200). Conceptos de fuerza nuclear fuerte y
débil.
Polémica Einstein / Bohr y Born (1927-1955): los experimentos imaginarios. El
reloj en la caja, la paradoja EPR (incompletitud de la teoría cuántica),
salto atrás en el tiempo (para un fotón el tiempo carece de sentido:
diagramas de Feynman).
Schroedinger (1935): el gato. Caja cerrada con una fuente radiactiva,
contador de radiación, botella cerrada con cianuro y gato vivo.
15. Astrofísica y cosmología.
ASIMOV: El Universo, Caps. 4 a 15.
Cap. 4: La Galaxia
La paradoja de Olbers
Hemos visto que hacia 1840 los astrónomos consiguieron por fin resolver el
problema de la distancia de las estrellas, o al menos de las más cercanas,
hallando que se encontraban a algo más de un parsec. La siguiente cuestión,
en cierto modo inevitable, era: ¿Dónde acaban las estrellas? ¿A qué distancia
se encuentra la estrella más lejana? A fin de cuentas, la Tierra tiene una
superficie finita y el sistema solar ocupa una porción limitada del espacio.
Pero al establecer el siguiente "nivel" ¿estamos todavía en el
dominio de lo finito o nos enfrentamos ya con lo infinito, ese concepto que
desde el principio preocupó tanto a los hombres de ciencia? Si nos
restringimos a la porción de espacio que se puede ver a simple vista, no cabe
duda de que el Universo es finito. Ahora bien, se sabe que, al menos en la
región que nos circunda, la distancia media entre dos estrellas cualesquiera
es de unos 3 parsecs (10 años-luz). También sabemos que a simple vista se
pueden observar unas 6.000 estrellas. Si suponemos que fuera de ellas no
existe ninguna más y que cada dos de ellas están separadas por la distancia promedio,
bastaría una esfera de unos 100 parsecs de diámetro, o 330 años-luz, para
abarcar esas 6.000 estrellas.
Esta cantidad resulta ciertamente impresionante al lado de los patrones
terrestres ordinarios. Un diámetro de 100 parsecs equivale aproximadamente a
tres mil billones de kilómetros (3.000.000.000.000.000); el tamaño de la
esfera correspondiente habría dejado atónito a cualquier astrónomo anterior
al año 1600 y a más de uno de los que vivieron después.
Pero el número de estrellas no es de 6.000 ni por aproximación. Desde el
mismo instante en que Galileo enfocó su primer telescopio hacia los cielos en
1609, descubrió un sinnúmero de estrellas tenues que a simple vista pasaban
inadvertidas. Y cada vez que introducía una mejora en el telescopio, se desvelaba
la existencia de una serie aún más copiosa de estrellas todavía más tenues.
De momento no parecía vislumbrarse ningún posible fin. En 1800 ya se había
pasado de un Universo de 6.000 estrellas y un diámetro de 100 parsec a otro
con un número infinito de estrellas y carente por completo de fronteras.
Siendo esto así, la pregunta "¿A qué distancia se encuentra la estrella
más lejana?" no tendría respuesta porque siempre cabía decir "si es
que no hay una estrella que sea la más lejana". Pero una vez más, la
idea del infinito repelía a la mente humana. El ataque contra la hipótesis de
un posible universo infinito se llevó a cabo en dos frentes: uno teórico, el
otro basado en la observación.
Las razones teóricas para dudar de la existencia de un universo de infinitas
estrellas surgieron de ciertas ideas expuestas por el astrónomo alemán
Heinrich Wilhelrn Mattháus Olbers (1758-1840), que en 1826 sugirió lo que más
tarde se llegó a conocer por la "paradoja de Olbers". Para
exponerla partamos de los siguientes supuestos:
1. El Universo tiene una extensión infinita.
2. Las estrellas son infinitas en número y están distribuidas uniformemente a
través del Universo.
3. Las estrellas tienen una luminosidad media uniforme a lo largo y a lo
ancho de todo el Universo.
Imaginemos el sistema solar situado en el centro de tal Universo y
consideremos que éste se halla dividido en finas capas concéntricas como las
de una cebolla. El volumen de tales capas aumentaría proporcionalmente al
cuadrado de la distancia. Si la capa A se encuentra tres veces más alejada de
nosotros que la capa B, aquélla tendrá un volumen 3 ' 6 9 veces superior al
de la capa B. Si las estrellas están distribuidas de un modo uniforme a
través de todas las capas (Supuesto 2 de arriba), entonces la capa A, con un
volumen nueve veces superior al de la B, contendría nueve veces más estrellas
que esta última.
Por otra parte, la luz de una estrella cualquiera disminuiría con el cuadrado
de la distancia. Si la capa A es tres veces más distante que la capa B y
contiene 9 veces más estrellas que ésta, cada una de las estrellas de la capa
A tendrá un brillo equivalente a sólo (1/3)' 6 1/9 del brillo de una estrella
cualquiera de la capa B (suponiendo una luminosidad media uniforme en todo el
espacio (Supuesto 3). Así pues, concluimos que la capa A tiene nueve veces
más estrellas que la capa B y que cada una de las estrellas de la A posee un
brillo equivalente a 1/9 del de una estrella cualquiera de la capa B, de
suerte que la cantidad de luz total suministrada por la capa A al sistema
solar sería de 9 X 1/9 la de la capa B. En resumen, ambas capas proporcionan
al sistema solar la misma cantidad total de luz. Pero el mismo argumento cabe
aplicarlo a cualquier otra capa, y dado que el número de capas es infinito
(Supuesto 1), la cantidad de luz que llegaría hasta nosotros sería infinita.
Esto no es del todo exacto, pues las estrellas más cercanas obstruirían el
paso a la luz de las más apartadas. Pero aun teniendo en cuenta este efecto
de pantalla, como cabría llamarlo, el cielo brillaría como la superficie de
un sol ingente, lo cual, desde luego, no es el caso.
Olbers sugirió que un modo de eludir esta paradoja sería admitir la
existencia de nubes de polvo en el espacio; estas nubes absorberían la luz
procedente de las estrellas muy alejadas, con lo cual nosotros sólo
recibiríamos la luz emitida por las relativamente cercanas. Esto no arreglaba
nada, pues a medida que las nubes de polvo fuesen absorbiendo luz se irían
calentando, hasta que en último término emitiesen una cantidad de luz igual a
la que absorben: la luz que llegaría hasta nosotros seguiría siendo infinita.
No cabe duda de que en los supuestos de Olbers tiene que haber algún fallo.
La extensión del Universo quizá no sea infinita, o si lo es, el número de
estrellas no debe ser ilimitado. Cabría esperar, por ejemplo, que el número
de estrellas fuese finito (aunque muy grande) y que éstas se encontraran
distribuidas a lo largo y a lo ancho de un espacio también finito (pero
vastísimo).
Esta conclusión, basada en el razonamiento de Olbers, concordaba
perfectamente con las cuidadosas observaciones astronómicas que por aquel
tiempo estaba realizando William Herschel.
La lente de Herschel
Una al menos de las hipótesis en que se apoya la paradoja de Olbers resulta
muy precaria a la vista de dichas observaciones. En principio nada se opone a
que la distribución de las estrellas sea uniforme en todo el espacio, pero
las observaciones de la porción del Universo visible desde la Tierra desde
luego no parecen confirmar este punto de vista.
A lo largo de todo el cielo y atravesando las constelaciones de Orión,
Perseo, Casiopea, Cisne, Aguila, Sagitario, Centauro y Carena, se extiende
una banda de suave luminosidad que corta al plano ecuatorial de la Tierra a
un ángulo de 62". En medio de las luces estridentes de una ciudad
moderna se desvanece, pero en pleno campo y en una noche sin luna constituye
una visión magnífica. Los antiguos que no conocían la dudosa bendición
(dudosa desde el punto de vista del astrónomo) de la luz eléctrica, conocían
muy bien esta banda luminosa. Los griegos le dieron el nombre de
"galaxias kyklos" "círculo lácteo") y los romanos la
llamaron "vía láctea", nombre con que se la conoce actualmente. La
palabra "galaxia" proviene de la versión griega de dicho nombre.
En 1610 Galileo observó la Vía Láctea a través de su telescopio rudimentario
y comprobó que no se trataba de una nube luminosa y uniforme, sino de una
colección ingente de estrellas muy tenues, como efectivamente habían sugerido
algunos filósofos de los tiempos pretelescópicos.
Parece evidente, pues, que el número de estrellas debe ser mucho mayor en la
dirección de la Vía Láctea que en cualquier otra. Además, las estrellas
brillantes y visibles son relativamente más abundantes en dicha dirección que
en otras lo cual contradice abiertamente la hipótesis de una distribución
estelar uniforme.
En su "escrutinio sistemático de los cielos", Herschel sabía muy
bien que las estrellas eran más numerosas en unas direcciones que en otras. Pero
no conformándose con una descripción meramente cualitativa, en 1784 decidió
contar las estrellas y estudiar exactamente cómo variaba su abundancia de un
lugar a otro.
La tarea de contar todas las estrellas del cielo hubiera sido, qué duda cabe,
una empresa imposible, por lo cual Herschel estimó oportuno limitarse a
efectuar un muestreo del cielo. Para ello eligió 683 regiones diseminadas a
lo largo y a lo ancho del cielo y contó las estrellas que se podían observar
en cada una de ellas a través del telescopio. Comprobó que el número de
estrellas por unidad de área celeste aumentaba continuamente en dirección a
la Vía Láctea alcanzaba un máximo en el plano de ésta y pasaba por un mínimo
en la dirección perpendicular a dicho plano,
¿Qué explicación admitía este resultado? Quizá fuese que las estrellas se
iban agolpando progresivamente a medida que se encontraban más cerca de la
Vía Láctea. ¿Pero qué razón había para que esto fuese así? No parece que
exista una razón simple que explique este acortamiento paulatino de las
distancias interestelares. A Herschel se le antojaba mucho más razonable
suponer que las estrellas se encontraban distribuidas a intervalos más o
menos uniformes, pero dentro de un volumen espacial que no era esférico y
que, por tanto, tampoco era simétrico en todas direcciones.
Supongamos que las estrellas están distribuidas uniformemente en un volumen
de espacio con forma de lente o de piedra de afilar y que nuestro Sol se
encuentra cerca del centro de masas del sistema total. Si miramos ahora en la
dirección del plano de la piedra de afilar, veremos cierto número de
estrellas brillantes cerca de nosotros, detrás una gran masa de estrellas
distantes y, por ende, muy tenues, detrás de ellas una masa aún más numerosa
de estrellas todavía más lejanas y oscuras, etc. El sinnúmero de estrellas
que veríamos en la lejanía remota serían demasiado oscuras para discernirlas
por separado, pero en masa conferirían al cielo una pálida luminosidad
lechosa, que constituiría la Vía Láctea.
Por otra parte, apartando progresivamente la vista del plano principal de la
piedra de afilar, lo que haríamos sería mirar a través de un espesor de
estrellas cada vez más pequeño, de suerte que sólo veríamos las más próximas
y brillantes, sin percibir detrás de ellas ninguna masa estelar distante ni
luminosidad lechosa alguna. Así pues, para Herschel las estrellas del
Universo constituían un "sistema sidéreo" finito con una forma bien
definida. (Con el tiempo, la palabra Galaxia llegó a significar el sistema
sidéreo total, en vez de limitarse a la Vía Láctea visible, por lo cual
cabría considerar el Sol como una de las estrellas de la Galaxia.)
Pero Herschel no se detuvo ahí, sino que, basándose en el número de estrellas
que podía observar en distintas direcciones y apoyándose en su hipótesis de
una separación interestelar uniforme, trató de hacer una estimación burda del
tamaño del sistema sidéreo. La conclusión a que llegó fue que el diámetro
máximo de esta Galaxia en forma de lente es unas 800 veces la distancia media
entre dos estrellas (distancia que tomó como igual a la que existe entre el
Sol y Sirio; este supuesto resultó ser correcto, al menos en lo que atañe a
las estrellas vecinas del Sol). En cuanto al diámetro mínimo de la Galaxia,
lo calculó en unas 150 veces la distancia media interestelar.
La idea de Herschel era, como vemos, la de una Galaxia que podía abarcar
300.000.000 de estrellas: 50.000 veces más que las que se podía observar a
simple vista. Por otro lado, si tomamos la distancia media interestelar como
10 años-luz (aunque conviene recordar que este tipo de distancias no fueron
determinadas sino dieciséis años después de la muerte de Herschel), la
Galaxia resulta tener un diámetro máximo de 8.000 años-luz y un diámetro
mínimo de 1.500 años-luz. Además, parecía lógico suponer que el Sol ocupase
un lugar próximo al centro de la Galaxia, habida cuenta de que la Vía Láctea
daba la sensación de rodear el cielo por completo y de que su brillo parecía
uniforme en todo punto.
Las observaciones de Herschel y el razonamiento de Olbers lograron enterrar
durante un siglo entero la noción de un Universo infinito. La labor de los
astrónomos del siglo XIX, en el sentido de contar y registrar con gran
precisión un número aún mayor de estrellas, no tuvo otra consecuencia que
refinar los detalles del esquema global de Herschel.
La penosa actividad de contar las estrellas "a ojo" culminó en el
mapa celeste conocido con el nombre de Bonoer Durchmusterung
("Prospección de Bonn"), que empezó a publicarse en 1859 bajo la supervisión
del astrónomo alemán Friedrich Wilhelm August Argelander (1799- 1875) de la
Universidad de Bonn. En este mapa se llegó a registrar la posición de medio
millón aproximadamente de estrellas.
Sin embargo, hacia la segunda mitad del siglo XIX, con el desarrollo de la
fotografía y su aplicación a la astronomía, la tarea de detectar a ojo
estrella por estrella dejó de ser un mal fatídico e inevitable. Bastaba tomar
una fotografía de una región determinada del cielo para "congelar"
esa zona de una vez para siempre: el recuento de estrellas se podía hacer con
toda comodidad y en el momento y lugar que más le conviniesen al astrónomo.
Uno de los astrónomos que hicieron uso abundante de esta técnica fue el
holandés Jacobus Cornelius Kapteyn (1851-1922). Kapteyn siguió el método de
muestreo de Herschel, pero fue más lejos que éste: emprendió un recuento
sistemático de las estrellas de cada magnitud.
Si el número de estrellas era infinito, la cantidad total de ellas contenidas
en cada una de las capas sucesivas del espacio debería aumentar
progresivamente, ya que a medida que nos movemos hacia el exterior las capas
van teniendo un volumen mayor y son capaces de abarcar más estrellas. Y
puesto que el brillo se atenúa en general con la distancia, debería observarse
un aumento constante en el número de estrellas a medida que decrece el
brillo.
Kapteyn observó, sin embargo, que el ritmo de aumento no era constante, sino
que empezaba a decaer en las magnitudes mayores, lo cual significaba que en
las capas muy distantes las estrellas empezaban a dispersarse; a partir de
aquí Kapteyn pudo estimar de una forma aproximada la distancia de aquellas
últimas capas en las que las estrellas concluían por desvanecerse.
Sus resultados confirmaron la imagen de Herschel de una Galaxia
"lenticular" con el Sol situado en el centro o cerca del centro, si
bien las cifras de Kapteyn relativas a las dimensiones de la Galaxia eran
mayores que las de Herschel: en 1906, el holandés logró estimar el diámetro
mayor de la Galaxia en 23.000 años-luz y el diámetro menor en 6.000 años-luz.
Hacia 1920 aumentó dichas cifras hasta 55.000 y 11.000 años-luz
respectivamente, dimensiones que suponían una Galaxia con un volumen 475
veces superior al de Herschel.
El Sol en movimiento
El sistema sidéreo esbozado por Herschel representó un nuevo golpe para las
valoraciones del hombre en punto a su propia importancia.
En tiempos de la Antigüedad, el hombre solía considerarse a sí mismo
literalmente como el eje del Universo. El Universo no sólo era geocéntrico
(siendo la Tierra - la casa del hombre - el centro inmóvil de todo cuanto
existía), sino también homocéntrico: el hombre era la medida de todas las
cosas.
Después de los trabajos de Copérnico, y una vez que se fue afincando y
aceptando paulatinamente la teoría heliocéntrica, resultaba difícil fijar la
verdadera importancia del hombre en el Universo. A fin de cuentas su planeta
sólo era uno entre muchos y, por añadidura, tampoco era, ni de lejos, el más
grande ni el más espectacular. La Tierra no podía competir con Júpiter en
tamaño ni con Saturno en belleza.
Sin embargo, para los astrónomos de los siglos XVII y XVIII el Sol constituía
el centro inamovible del Universo y el Sol, en cierto modo, nos pertenecía:
era la fuente de luz y de calor y el origen de toda la vida terrestre. Pero a
medida que se fue desvaneciendo la noción de la bóveda celeste rígida,
parecía cada vez menos probable que el Sol pudiese tener esa importancia tan
categórica. Si las estrellas se encontraban diseminadas en una región vastísima
del espacio y el Sol no era sino una de dichas estrellas, ¿qué razón había
para suponer que éste fuese el centro del Universo? Por otra parte, si se
admitía una Galaxia del tamaño sugerido por Herschel, una Galaxia poblada por
cientos de millones de estrellas, ¿cómo era posible afirmar seriamente que
nuestro Sol contaba tanto entre este sinfín de astros diseminados a tales
distancias?
Más tarde, conforme se fueron observando los movimientos propios de un número
cada vez mayor de estrellas, se vio que no parecía existir ningún indicio de
que las estrellas en general describiesen órbitas gigantescas alrededor del
Sol. La naturaleza de estos movimientos parecía más bien aleatoria, y esto
empezó a despertar la sospecha de que todas las estrellas se movían de una
forma más o menos caótica (como abejas en un enjambre) y que aquellas que no
exhibían ningún movimiento propio - o se encontraban demasiado lejos para
manifestar tal movimiento a corto plazo - no lo exhibían porque daba la
casualidad de que se movían justamente hacia nosotros o alejándose de
nosotros, con lo cual resultaba imposible detectar ningún movimiento propio
transversal.
Pero en estas condiciones también era razonable suponer que el Sol se
moviera, pues de otro modo ¿a qué respondía que éste fuese el único astro
inmóvil en un Universo de estrellas viajeras? Tal fue el razonamiento que
hizo Herschel en 1783 y que le llevó a abordar la tarea de averiguar el
posible movimiento del Sol.
Supongamos que el Sol se encuentra rodeado de estrellas, distribuidas
uniformemente en el espacio. Aquellas que están próximas al Sol aparecerán
separadas por distancias relativamente grandes, mientras que esas otras que
se hallan muy lejos se nos antojarán bastante cercanas entre sí. Es el mismo
fenómeno que se observa mirando los árboles de un vivero o los individuos de
una formación en filas y columnas: se trata de un efecto de perspectiva. Así
pues, si transportásemos un grupo de estrellas a una distancia menor que la
que ocupaban anteriormente, sin alterar su posición relativa, daría la
sensación de que las estrellas se separan unas de otras. Es decir, en el
proceso de acercamiento parecerían alejarse entre sí. Por otro lado, un grupo
de estrellas que se alejasen del Sol darían la impresión de converger.
Invirtiendo el razonamiento, está claro que si el Sol se mueve a través de la
Galaxia, las estrellas situadas delante de él y en la dirección del
movimiento parecerían aproximarse al Sol y, por consiguiente, que divergen.
(Este efecto quedaría enmascarado en parte por el hecho de que las estrellas
no permanecen quietas, sino que poseen movimientos en todas direcciones; sin
embargo, el enmascaramiento no sería total). Asimismo. las estrellas situadas
detrás del Sol y en dirección opuesta a la de su avance parecerían alejarse
de él y que convergen. Y por último, aquellas otras situadas en ángulo recto
a la dirección del Sol poseerían los movimientos propios mayores, y estos
movimientos tenderían a ser, en general, opuestos a la corrección de avance
del Sol.
Pocos eran los movimientos propios que se conocían en tiempos de Herschel,
pero basándose en ellos y en el razonamiento que acabamos de exponer, este
astrónomo consiguió establecer que el Sol efectivamente se mueve y que lo
hace en dirección a cierto punto de la constelación Hércules. Estimación que
se ha comprobado no era nada mala. En el siglo y medio que siguió a la obra
de Herschel se determinaron otros muchos movimientos propios, pero hoy día se
sigue considerando que el "ápex", o punto hacia el cual parece huir
el Sol, no difiere gran cosa del que determinó Herschel. Según las
observaciones más precisas de que se dispone en la actualidad, dicho punto
parece hallarse en la constelación de Lira, vecina de Hércules. El Sol se
mueve hacia el ápex a una velocidad (en relación con las estrellas más
cercanas) de unos 19 kilómetros por segundo.
Cúmulos estelares
Así pues, el hecho de que el Sol parezca hallarse en el centro (o cerca del
centro) del modelo Herschel-Kapteyn de la Galaxia no debe tomarse como un hecho
demasiado significativo. Se trata más bien de una circunstancia fortuita,
pues sí la Humanidad hubiera realizado sus observaciones astronómicas en otra
época del pasado remoto o del futuro lejano, se habría encontrado situada en
un extremo u otro de la Galaxia.
Afirmar que el Sol (y con él la Tierra y el propio hombre) se encuentra en el
centro de todas las cosas por pura casualidad no es precisamente un regalo
para la vanidad humana. Pero incluso esta concepción empezó a tambalearse y a
resultar cuestionable a medida que Kapteyn fue puliendo los últimos detalles
de su modelo en las dos primeras décadas del siglo XX.
Los problemas con que tropezó el modelo Herschel-Kapteyn se derivaban de
ciertos resultados que concernían no tanto a las estrellas tomadas una a una
como a grupos de ellas. Tales grupos son perceptibles incluso a simple vista.
El más conocido son las "Pléyades", un pequeño cúmulo de estrellas
de brillo moderado en la constelación Tauro, el Toro. Nueve de las estrellas
del cúmulo son suficientemente brillantes para poder ser observadas a simple
vista, aunque algunas de ellas se encuentran muy juntas y es difícil
discernirlas por separado. Un hombre de vista normal puede distinguir seis o
siete. (Este cúmulo se denomina a veces "Siete Hermanas".)
Cuando en 1610 Galileo enfocó su telescopio hacia las Pléyades, comprobó que
podía contar sin esfuerzo alguno 36 estrellas en dicho grupo. Los métodos
fotográficos, modernos revelan 250 como mínimo y el número total asciende
probablemente a cerca de 750. Las Pléyades constituyen una asociación
auténtica de estrellas; no se trata de la imagen accidental de una serie de
estrellas situadas a distancias variables, pero todas ellas cerca de una
misma línea visual. Esto quedó ya demostrado en 1840 cuando Bessel comprobó
que el movimiento propio de todos los miembros de este cúmulo era de 5,5
segundos de arco por siglo en la misma dirección Si se tratara de estrellas
independientes, sería demasiada coincidencia que todas ellas se moviesen en
la misma dirección y a la misma velocidad.
Los astrónomos han estimado que la distancia media entre las estrellas del
cúmulo de las Pléyades equivale sólo a un tercio de la separación
interestelar media en las proximidades de nuestro sistema solar. Hoy se sabe
que el grupo entero se encuentra a unos 400 años-luz de nosotros y que abarca
una región del espacio de unos 70 años-luz de diámetro.
Aun cuando las Pléyades son el cúmulo más grandioso de cuantos se pueden
observar a simple vista, no constítuyen sino una muestra sumamente pálida de
los espectáculos que se nos ofrecen a través del telescopio. Sin
proponérselo, el astrónomo francés Charles Messier (1730-1817) consiguió
vislumbrar estas glorias mayores mientras buscaba objetos celestes mucho más
modestos. Messier era un "cazador de cometas" y a lo largo de su
vida descubrió buen número de ellos. Pero cansado de verse burlado por
objetos celestes difusos, permanentemente fijos y que, por tanto, no eran
cometas, trazó en 1781 un mapa detallado señalando la posición de cuarenta de
tales objetos con el fin de que él mismo, y otros cazadores de cometas,
conocieran su situación y aprendieran a ignorarlos en lo sucesivo. Con el
tiempo, Messier y otros astrónomos incrementaron hasta cien el número de
objetos de la lista.
Entre estos cien figuraba un objeto difuso con aspecto de estrella, que había
sido observado por primera vez por Halley en 1714. Como en la lista de
Messier ocupaba el puesto decimotercero, a veces recibe el nombre de M13.
Décadas más tarde, Herschel estudió M13 con ayuda de un telescopio mucho más
perfecto que el de Messier y comprendió que lo que tenía ante sus ojos no era
un simple borrón de luz, sino un conglomerado esférico de estrellas
densamente empaquetadas.
Las Pléyades consistían en un grupo de estrellas relativamente separadas, por
lo que recibieron el nombre genérico de "cúmulo abierto"; el objeto
M13, por el contrario, era una aglomeración de estrellas muy juntas, razón
por la cual fue denominado "cúmulo globular" El cúmulo M13 también
se conoce con el nombre de "Gran Cúmulo de Hércules", debido a que
está situado en la constelación de ese nombre. Un cúmulo globular se compone,
no ya de cientos, sino de miles de estrellas. En el Gran Cúmulo de Hércules
se han contado unas 30.000 estrellas, y el número total seguramente excede de
100.000 y quizá se aproxime al millón. Cerca del centro del cúmulo, las
estrellas deben de estar distribuidas con separaciones bastante menores de 1
año-luz.
Ahora bien, éste no es el único cúmulo globular. En la lista de Messier
aparecen varios otros, entre ellos M3 en la constelación Canes Venatici
(Lebreles) y M22 en la constelación de Sagitario. Hoy día se conocen cien
cúmulos globulares y se supone que son unos trescientos los que existen en
total en nuestra Galaxia.
Un hecho curioso es que los cúmulos globulares no están distribuidos de modo
uniforme en el cielo; el primero en señalarlo, a principios del siglo XIX,
fue John Herschel (1792-1871), hijo del famoso William Herschel y a su vez un
astrónomo de fama. En efecto, casi todos los cúmulos globulares están
localizados en uno de los hemisferios del cielo y un tercio de ellos se
agolpan en la constelación de Sagitario, que sólo ocupa un 2% de la
superficie celeste. John Herschel opinó que este fenómeno, lejos de ser accidental,
debía poseer algún significado.
Pero el significado mismo se les escapó a los astrónomos durante todo el
siglo siguiente, debido en parte a que se ignoraba la posición real de estos
cúmulos globulares en el espacio. Su distancia era demasiado grande para
poder medir el paralaje; y hasta el siglo XX este método, el del paralaje,
era el único que se conocía para determinar las distancias sidéreas.
Estrellas variables
A principios del siglo XX, y en conexión con el estudio de cierto tipo de
"estrellas variables", se halló un método adecuado para afrontar el
problema de los cúmulos globulares. (Las estrellas variables son aquellas
cuyo brillo cambia periódicamente).
La historia de las estrellas variables resulta sorprendentemente breve si
tenemos en cuenta que existen estrellas, con brillo suficiente para ser
observadas a simple vista, cuya luz varía de un modo ostensible. Los
astrónomos antiguos no nos legaron ningún comentario acerca de tales
variaciones. De hecho, el punto de vista griego, representado por
Aristóteles, venía a afirmar que todo cuanto hay en los cielos es permanente
e inmutable. Mas esta opinión oficial y categórica en nada cambiaba el hecho
de que las estrellas variables existen, demostrando que en los cielos sí se
producen cambios.
Entre las estrellas variables y observables a simple vista la más notable es
Beta Persei, que ocupa el segundo lugar en la escala de brillo de la
constelación de Perseo. Esta estrella se apaga y se ilumina de un modo
perfectamente perceptible. Cada dos días y veintiuna horas pierde en poco
tiempo algo más de una magnitud de brillo durante un breve período,
recuperando luego la pérdida con igual rapidez.
Ni los griegos ni los árabes (estos últimos los grandes astrónomos de la Alta
Edad Media) hicieron mención alguna de este fenómeno, aunque es posible que
algún individuo aquí o allá lo registrase, con gran estupor por su parte. Los
griegos, en su fantástica descripción de las estrellas de esta constelación,
imaginaban a Beta Persei situada en la cabeza de Medusa, sostenida ésta por
Perseo. Medusa era un ser demoníaco: tenía por cabello serpientes vivas y su
rostro era tan horrible que cualquiera que lo contemplaba se convertía en
piedra. Beta Persei era conocida a veces con el nombre de "Estrella del
Diablo", lo cual ya indica que en ella se había observado algo fuera de
lo normal. El nombre árabe de la estrella es Algol ("el vampiro"),
que también sugiere algo escalofriante.
En 1782, el astrónomo inglés John Goodrícke (17641786) estudió la estrella
Algol con detalle y llegó a la conclusión de que alrededor de ella giraba
otra muy tenue, describiendo una órbita cuyo plano aparecía casi de canto
visto desde la Tierra. De este modo, cada vez que se interponía entre Algol y
nuestro planeta, ocultaba parte del brillo de aquélla. Esta hipótesis no fue
tomada en serio en aquel tiempo, pero las observaciones efectuadas desde
entonces han venido a demostrar con certeza casi absoluta que era correcta.
Hoy día, Algol pasa como el mejor ejemplo conocido de una "binaria con
eclipse". No es que su luz crezca y mengüe en realidad, sino que se ve
obstruida periódicamente.
Pero el sistema es todavía más complicado. Las dos estrellas que se eclipsan
mutuamente se encuentran separadas por una distancia de más de tres millones
de kilómetros, pero alrededor de ambas gira todavía una tercera, mucho más
lejana aún, con un período de 22 meses.
La variabilidad de la luz debida a los eclipses no tiene nada que ver con la
estructura interna o las propiedades de la estrella. Si el compañero de Algol
girase alrededor de él en otro plano, sin interponerse entre la Tierra y
Algol, ésta no sería considerada como una estrella variable.
Muy diferente es el caso de la estrella Omicron Ceti, perteneciente a la
constelación Cetus (la Ballena). El primero en observar de una forma detenida
esta estrella fue el astrónomo alemán David Fabricius (1564-1617) en 1596. En
sus momentos de máximo brillo, Omicron Ceti llega a alcanzar una magnitud de
2 y en sus momentos más tenues es demasiado oscura para percibirla a simple
vista. Este fenómeno le valió el nombre de "Mira"
("maravillosa"). Su período de variación - o tiempo que transcurre
entre dos momentos de máximo brillo consecutivos - es de once meses: período
más bien largo para una estrella variable, por lo cual Mira se incluye entre
las "variables de período largo".
A diferencia de Algol, Mira es auténticamente variable. La conclusión a que
han llegado los astrónomos es que el aumento y disminución de brillo no son
aparentes, sino reales. De ahí que Mira también se clasifique entre las
"variables intrínsecas".
Otro ejemplo de variable intrínseca es Delta Cephei, la cuarta estrella, en
cuanto a brillo, de la constelación de Cefeo. Delta Cephei difiere
notablemente de Mira: en primer lugar, el período de variación de aquélla es
corto, de 5,37 días, y en segundo lugar es regular.
Aparte de Delta Cephei se han descubierto otras estrellas variables con
períodos de variación cortos y regulares. Por lo común, éstos oscilan entre
dos y cuarenta y cinco días; los períodos de aproximadamente una semana son
muy usuales. La manera en que el brillo de estas estrellas crece y disminuye
es también muy típico, por lo cual se las agrupa bajo la denominación de
"variables Cefeidas" o simplemente "Cefeidas'" por ser una
estrella de la constelación de Cefeo la primera de este grupo que se estudió.
Aunque las Cefeidas eran objetos curiosos e interesantes, al principio no
parecieron poseer una importancia especial. Concepción que cambió
radicalmente en 1912, cuando la astrónomo americana Henrietta Swan Leawitt
(1868-1921) comenzó a localizar y a estudiar sistemáticamente cientos de
variables Cefeidas en la Nube Pequeña de Magallanes, trabajando en un
observatorio instalado por la Universidad de Harvard en Arequipa, Perú.
La Nube Pequeña de Magallanes es una de dos zonas luminosas (la otra es la
Nube Grande de Magallanes) que comparecen como manchas aisladas en la Vía
Láctea. Están situadas bastante al sur, por lo cual resultaban invisibles
desde la zona septentrional templada. Fueron descritas por primera vez en
1521 por el cronista que acompañó a Magallanes en su viaje alrededor del
globo; de ahí su nombre. Las Nubes de Magallanes no fueron estudiadas con
detalle hasta 1834, año en que John Herschel las observó desde el observatorio
astronómico del Cabo de Buena Esperanza. Al igual que la Vía Láctea, estaban
constituidas por un sinfín de estrellas muy tenues; y se suponía que esta
tenuidad se debía a su enorme distancia. De hecho, las Nubes están tan lejos
de nosotros que la diferencia de distancia entre las estrellas más próximas y
las más distantes (dentro de las mismas Nubes) puede considerarse como poco
importante en términos relativos. Esto es análogo a decir que todos los
habitantes de Chicago se encuentran a la misma distancia de Times Square en
Nueva York; evidentemente, la gente de los barrios del Oeste de Chicago se
encuentran un poco más próximos que los del Este de dicha ciudad, pero la
diferencia es insignificante al lado de la distancia total. En otras palabras,
podemos pensar que todas las estrellas de la Nube Pequeña de Magallanes, y en
particular todas las Cefeidas, distan lo mismo de la Tierra. Si una Cefeida
exhibe un brillo mayor que las demás, esta diferencia sólo se puede atribuir
a que de hecho es más brillante (más luminosa), sin necesidad de especular
con el factor distancia.
En sus estudios sobre las Cefeidas de la Nube Pequeña de Magallanes,
Henrietta Leavitt observó que cuanto más brillante era una variable Cefeida,
mayor era también su período. Una Cefeida de esta Nube con una magnitud de
15,5 tenía un período de dos días; otra de magnitud 14,8, un período de cinco
días; y el período de una tercera de magnitud 12,0 era de 100 días. Al
parecer, la luminosidad y el período estaban ligados por alguna relación
regular.
Además de para las Cefeidas de las Nubes de Magallanes, esta relación debía
ser válida para aquellas que se hallan en la vecindad de nuestro sistema
solar. (Los científicos suelen suponer que si una relación se cumple en
cierto lugar o bajo un conjunto dado de condiciones, también será válida en
cualquier otro lugar o bajo otro conjunto de condiciones, al menos mientras
no se demuestre lo contrario.) Entonces ¿por qué no se observaba dicha
relación en las proximidades de nuestro sistema? El problema estriba en que
en nuestra vecindad inmediata la luminosidad puede quedar enmascarada como
resultado de la distancia. Una Cefeida muy luminosa con un período largo es
posible que parezca tenue como consecuencia de su enorme distancia, mientras que
otra mucho menos luminosa y con un período corto quizá se encuentre cerca de
nosotros, antojándosenos muy brillante. En tal caso, las estrellas brillantes
parecerán tener períodos cortos, y las tenues períodos largos. La confusión
inducida por las distancias lleva incluso a pensar que no existe conexión
alguna entre el brillo y el período. Y es que de hecho no existe: la relación
es entre la luminosidad y el período; a partir del brillo aparente de una
estrella es imposible deducir la luminosidad real, a menos que conozcamos la
distancia de la estrella.
Desgraciadamente, en 1912 no se conocía la distancia de ninguna Cefeida. Para
medir distancias sólo se disponía del método de paralajes, y esta técnica
tenía muchas limitaciones: cuanto más lejana la estrella, menor el paralaje y
mayor la dificultad para medirlo. Incluso en nuestros días, el método
paraláctico resulta inaplicable para distancias superiores a los 150
años-luz, y ninguna variable Cefeida se halla a una distancia tan exigua. La
más próxima dista como mínimo 400 años-luz.
Henrietta Leavítt fue capaz de observar la relación luminosidad-periodo en la
Nube Pequeña de Magallanes, no porque conociera la distancia de la Nube, sino
porque dentro de ésta las distancias no importaban. Dentro de la Nube, el
brillo era proporcional a la luminosidad, por lo cual la relación
luminosidad-período se manifestaba en una conexión brillo-período fácil de
detectar. Ahora bien, una vez descubierta esta relación podía ser aplicada a
nuestra vecindad próxima como patrón de medida para determinar distancias muy
superiores a las que se podían hallar por el método paraláctico.
Supongamos, por ejemplo, que observamos que dos Cefeidas tienen períodos
iguales, pero una de ellas es más brillante que la otra. Sus luminosidades
deben ser iguales. Puesto que sus períodos lo son, de suerte que la
diferencia en el brillo aparente sería un efecto de la distancia. El resto no
plantearía problemas: averiguar cuánto más lejos debe encontrarse una Cefeida
que la otra para explicar la diferencia de brillo observada. En el caso
contrario de que las dos Cefeidas tuviesen períodos diferentes, también era
posible calcular su diferencia de luminosidad. La diferencia en la magnitud
aparente podía medirse directamente y ambos datos juntos permitían calcular
las distancias relativas. Este tipo de cálculos de distancias relativas lo
único que proporcionaba era una imagen a escala de la galaxia (como antes las
leyes de Kepler en relación con el sistema solar), pero no decían nada acerca
de las distancias reales. Sin embargo, el método no estaba completamente
desprovisto de valor.
En los años que siguieron al descubrimiento de Leavitt, el astrónomo
americano Harlow Shapley (n. 1885) aprovechó la escala Cefeida para estudiar
los cúmulos globulares. Muchos de estos cúmulos contenían cierto número de
variables Cefeidas. Midiendo los períodos de estas variables, Shapley podía
determinar su luminosidad relativa, y comparando este factor con el brillo
aparente era posible conocer las distancias relativas de las Cefeidas y, por
ende, las distancias relativas de los cúmulos globulares a que aquéllas
pertenecían. Cuando un cúmulo no contenía ninguna Cefeida claramente visible,
Shapley medía la magnitud aparente de las estrellas más brillantes del cúmulo
en cuestión, suponiendo que en todos los casos el brillo intrínseco de éstas
era el mismo.
Todos estos cálculos parecían indicar que los cúmulos globulares estaban
distribuidos en una configuración esférica, constituyendo algo así como un
gran balón con su centro en la dirección de la constelación Sagitario. Los
astrónomos terrestres, observando este balón de cúmulos globulares desde el
exterior - desde un exterior muy remoto - veían esta estructura gigantesca
como localizada en una porción relativamente exigua de los cielos en las
inmediaciones de Sagitario. ¿Cuál era la razón de que los cúmulos globulares
estuviesen dispuestos de esta forma tan peculiar? Shapley creyó lógico
suponer que los cúmulos se agrupaban en torno al centro masivo de la Galaxia,
del mismo modo que los planetas se apiñaban alrededor del Sol, el centro
masivo del sistema solar. Si esta hipótesis fuese cierta, el Sol se
encontraría muy lejos del centro galáctico, es decir, no nos hallaríamos en
el centro, sino en las afueras de la Galaxia.
Para saber a qué distancia se encontraba el centro galáctico, o lo que es lo
mismo, a qué distancia en las afueras se hallaba nuestro sistema solar, sólo
faltaba averiguar, pues, la distancia que mediaba entre nosotros y la esfera
de cúmulos globulares. Y para ello bastaba determinar la distancia de una
sola Cefeida: así quedaría resuelto el problema de las dimensiones reales de
la Galaxia (y posiblemente del Universo, caso de que éste se redujese a la
Galaxia). Mas ¿cómo llegar a conocer la distancia de las Cefeidas, cuando
ninguna de ellas está suficientemente próxima para medir su paralaje? Si
queremos explicar el método que utilizó Shapley para soslayar este
contratiempo puramente fortuito, no tendremos más remedio que zambullirnos en
un digresión más bien larga y retroceder unos tres cuartos de siglo en el
tiempo.
Cap. 5: El tamaño de la Galaxia
El efecto Doppler
Aquellos de entre nosotros que, por su edad, vivieron los días en que el
ferrocarril era un medio de transporte mucho más común que en la actualidad,
saben que el sonido del silbato de un tren es más agudo cuando éste se
aproxima que cuando se encuentra en reposo con relación a nosotros, y que
cuando se aleja es más grave que cuando se halla quieto con respecto al
observador. Un viajero que se hallara esperando en una estación y que viera
aproximarse un tren, luego pasar delante de él sin parar y por último
alejarse, percibiría un descenso brusco en la altura del silbido en el
momento en que el tren pasase delante de él. Este fenómeno fue explicado con
todo detalle en 1842 por el físico austríaco Christian Johann Doppler
(1803-1853). (...) En resumen: la longitud de onda de un sonido
producido por un silbato que se aleja es más larga - y la frecuencia más baja
- que en el caso de que el tren se encontrara en reposo. Este cambio de
frecuencia debido al movimiento se denomina "efecto Doppler" en
honor al físico de este nombre.
El espectro
En teoría, este mismo efecto debe observarse en el caso de cualquier tipo de
ondas radiadas hacia el exterior desde una fuente, y en particular debe
detectarse en el caso de la luz, como Doppler mismo señaló. La luz, al igual
que el sonido, es una forma de ondas (aunque no del mismo tipo). La luz
también posee longitud de onda y las diferencias en estas longitudes de onda
son susceptibles de ser percibidas por los sentidos como diferencias de
color. Las longitudes de onda más largas (de entre las visibles) se perciben
como rojo. A medida que la longitud de onda disminuye, el color va pasando
por el naranja, amarillo, verde, azul y violeta, en este orden. Los colores
no se diferencian de una manera tajante, naturalmente, sino que la transición
de unos a otros es gradual. Obsérvese, por ejemplo, el arco iris. Isaac
Newton fue el primero en estudiar con detalle un arco iris artificial. En
1666, Newton hizo el siguiente experimento: dejó que un rayo de luz penetrase
en un cuarto oscuro a través de un orificio practicado en la persiana y que
dicho rayo atravesara luego un trozo de vidrio triangular o "prisma".
Al pasar por el prisma, el rayo de luz se refractaba, yendo a incidir sobre
la pared opuesta del cuarto en forma de una mancha extensa formada por
colores sucesivos, de aspecto similar al arco iris. Newton bautizó esta banda
de colores con el nombre de "espectro".
De este modo, Newton demostró que la luz solar no era una entidad pura y sin
mezcla alguna, pues de haber sido así la luz se habría refractado en bloque,
como un todo, incidiendo sobre la pared en la forma de un rayo de luz blanca
exactamente igual que el rayo original. Pero las cosas no ocurrían así;
parecía más bien que estuviese compuesta efectivamente por una mezcla de una
gama muy amplia de tipos de luz, cada uno de los cuales se refractaba con un
ángulo ligeramente diferente y era interpretado por el sentido de la vista
como un color distinto. La mezcla de todas estas variedades, en las
proporciones en que aparecen en la luz solar, es percibido por el hombre como
luz blanca.
Llegados a este punto diremos que los distintos tipos de luz que componen la
luz solar se distinguen entre sí por su longitud de onda. El ángulo con el
cual un trozo de vidrio refracta un rayo de luz depende de la longitud de
onda de ésta; a menor longitud de onda, mayor refracción. La luz naranja se
refracta más que la roja, la amarilla más que la naranja, etc. La luz violeta
es la que sufre una refracción mayor. En el espectro final, la luz roja ocupa
el extremo menos refractado, es decir, aquel que se halla más próximo a la
dirección de marcha del rayo de luz original, todavía sin refractar. La luz
violeta ocupa el extremo opuesto. Dentro de un mismo color - naranja, por
ejemplo - las longitudes de onda más largas, rayanas ya en el rojo, se
encuentran situadas hacia el extremo rojo del espectro, mientras que las más
cortas, bordeando ya el amarillo, se hallan hacía el extremo violeta del
espectro.
Supongamos ahora que intentamos aplicar el efecto Doppler a la luz. En líneas
generales cabe decir que el Sol ni se aproxima a la Tierra ni se aleja de
ella, debido a lo cual produce lo que para nuestros sentidos es un espectro
equilibrado, compuesto de una mezcla que nuestra vista interpreta como
blanca. Ahora bien, sí el Sol se moviera hacia la Tierra ¿acaso no sería
lícito suponer que las longitudes de onda de la luz se comprimirían y que
cada una de las longitudes de onda que llegasen hasta nosotros sería más
corta que lo normal? De este modo, el espectro entero se desplazaría hacia el
extremo de las longitudes de onda cortas. Cada fragmento de la banda roja se
desplazaría hada el naranja, cada fragmento del naranja se correría
correspondientemente hacia el amarillo, y así sucesivamente. Dado que el
corrimiento global sería hacia el extremo violeta del espectro, se habla de
un "Corrimiento al violeta".
En tales condiciones no cabe esperar ya que la mezcla de luz del espectro
produzca un blanco característico En el extremo rojo habría una deficiencia y
en el violeta un exceso, con lo cual el color del Sol (en el supuesto de que
se moviese en dirección a la Tierra) tomaría un tinte azulado. Siguiendo este
razonamiento, cuanto más deprisa se aproximara el Sol hacia nosotros, más
azul sería su luz. El mismo argumento, pero invertido, valdría para predecir
lo que ocurriría si el Sol se alejase de nosotros. En este caso, las crestas
de las ondas luminosas tenderían a separarse unas de otras. Las longitudes de
onda se alargarían más de lo normal y el espectro se correría en bloque hacia
el extremo rojo: entonces se habla de "corrimiento al rojo". Si el
Sol se moviese alejándose de nosotros, su luz adquiriría un tinte naranja. Y
cuanto más rápido fuese este alejamiento, más naranja sería la luz. Pues
bien, a pesar de que este razonamiento parece impecable, los hechos lo
traicionan. El problema estriba en que la luz que vemos en un espectro no constituye
ni mucho menos el espectro completo.
En 1800, William Herschel estudió el espectro producido por la luz del Sol
(el "espectro solar") y observó el efecto térmico inducido sobre un
termómetro por las diferentes porciones del espectro, midiendo de este modo
el contenido energético total de cada una de dichas porciones. En este
sentido era natural esperar que el aumento de temperatura se hiciese cada vez
menos marcado y concluyese por desaparecer a medida que nos moviésemos hacia
el extremo del espectro. Pero en el caso del extremo rojo las cosas no
ocurrían así. El aumento de temperatura en un punto situado algo más allá del
extremo rojo era mayor que el correspondiente a cualquier otro punto del
espectro. Herschel dedujo de aquí que la luz del Sol incluía longitudes de
onda más largas que las que nuestra vista puede detectar. Tales longitudes de
onda se refractarían aún menos que las de la luz roja y estarían localizadas
más allá del extremo rojo del espectro. Se trataría de "radiación
infrarroja". Tal radiación sería desde luego real y sólo diferiría de la
luz ordinaria en el tamaño de su longitud de onda y en el hecho de que no es
perceptible para la vista humana. De suerte que hacía 1800 ya no podía
hablarse simplemente de "luz" para designar aquello en virtud de lo
cual percibimos visualmente, sino que era preciso hablar de "luz
visible". La luz invisible dejaba de ser una contradicción intrínseca
para convertirse en un hecho real (aun cuando hoy día la luz infrarroja se
detecta fácilmente con instrumentos apropiados, no obstante ser invisible
para el hombre).
Pero tampoco el extremo violeta. del espectro era un extremo propiamente
dicho. En 1801 el físico alemán Johann Wilhelm Ritter (1776-1810) estaba
estudiando la capacidad de la luz para inducir ciertas reacciones químicas.
Por ejemplo, la luz era capaz de provocar la descomposición de un producto
químico blanco, el cloruro de plata, liberando minúsculas partículas de plata
metálica. Fraccionados en partículas diminutas, los metales adquieren por lo
general un color negro; también el cloruro de plata, expuesto a la luz, se
ennegrecía progresivamente. Ritter observó que las distintas partes del
espectro solar no se mostraban igual de eficaces a la hora de provocar este
cambio. Cuanto más corta era la longitud de onda, más rápido era el proceso
de ennegrecimiento del cloruro de plata. Inspirado por el descubrimiento que
Herschel hiciera el año anterior, Ritter empezó a trabajar con la región
situada más allá del extremo violeta del espectro, en la cual la luz ya no
era visible. El resultado no dejaba lugar a dudas: el cloruro de plata se
oscurecía más deprisa que trabajando con cualquier otra zona del espectro
visible.
La conclusión a deducir era que en la luz solar existían longitudes de onda
más cortas que cualquiera de las que se podían detectar con la vista. Tales
longitudes de onda se refractarían aún más que las de la luz violeta y
estarían localizadas más allá del extremo violeta del espectro. Es lo que se
denomina "radiación ultravioleta".
Así pues, el espectro producido por el Sol (y por otras estrellas) debemos
imaginárnoslo como compuesto no sólo por los colores visibles (rojo hasta
violeta), sino también por regiones de luz invisible más allá del rojo y del
violeta. Cuando una estrella se mueve hacia nosotros, de modo que las
longitudes de onda de la luz que emite se acortan y su espectro experimenta
un corrimiento al violeta, la luz no se "apila" en el extremo
violeta, sino que se "derrama" por encima de éste e invade la
región ultravioleta invisible. Y este corrimiento tampoco deja una zona
vacante en el extremo rojo: la radiación infrarroja se convierte en radiación
roja visible por arte del acortamiento de la longitud de onda, pasando así a
ocupar el hueco. El espectro se desplaza en bloque, pero la porción visible
permanece inalterada; lo que pierde en un extremo lo gana en el otro. El
mismo argumento sería válido en el caso de que la estrella se alejase de
nosotros, sólo que entonces el corrimiento sería hacia el rojo. No cabe duda
de que si la estrella se aproximara hacia nosotros a tal velocidad que toda
la región infrarrojo penetrase en la zona visible, o si se alejara tan
deprisa que la región ultravioleta entera invadiese dicha zona, se produciría
efectivamente un desplazamiento visible de color hacia el violeta o hacia el
rojo, según los casos. Sin embargo, las velocidades de aproximación o de
alejamiento necesarias para originar tales desplazamientos globales en el
color son tan grandes, que parecía inconcebible (al menos en el siglo XIX)
que tales velocidades pudieran darse entre los objetos celestes. Y sin
embargo, existen diferencias de color entre las estrellas. Algunas de ellas -
Antares, por ejemplo - son marcadamente rojizas; otras, como Vega, son de
color azulado. ¿Hay que deducir de ello que Antares se aleja velozmente de
nosotros o que Vega se acerca a la Tierra a gran velocidad? Por desgracia, no
necesariamente, pues hay otras causas capaces de producir diferencias de
color.
El Sol enrojece a la hora del crepúsculo a pesar de que no se está alejando
de la Tierra. Lo que ocurre es que en ese momento la luz del Sol tiene que
atravesar un espesor muy ancho de atmósfera hasta llegar a nosotros, por lo
que las moléculas y las partículas de polvo contenidas en aquélla poseen muchas
más oportunidades de reflejar y dispersar la luz solar. Este proceso de
dispersión es más eficaz para las longitudes de onda cortas que para las
largas. De día, el cielo se ve azul debido a la dispersión de las longitudes
de onda cortas del espectro. La cantidad de luz dispersada de esta forma
cuando el Sol está alto no es suficiente para modificar el color de la luz
solar de un modo apreciable. Pero a medida que el Sol se aproxima al
horizonte, la cantidad de radiación corta dispersada y eliminada por ese
espesor cada vez mayor de atmósfera polvorienta va aumentando y la parte que
queda es de un color marcadamente rojo.
Por otra parte, una sustancia incandescente cambia de color al variar su
temperatura. Si calentamos progresivamente una bola de hierro, llega un
momento en que emitirá un color rojo intenso. Si seguimos aumentando la
temperatura, adquirirá un rojo más brillante, después se tornará naranja,
luego blanquecino y por último blanco azulado. Cuanto más alta es la
temperatura, mayor es el desplazamiento global de la luz emitida hacia las
longitudes de onda más cortas. Y, evidentemente, tal fenómeno no implicaría
ningún movimiento de la esfera de hierro: ni hacía el observador ni
alejándose de él.
Por último, el color puede variar con la composición química. En el caso de
que el objeto sea visible por medio de la luz que refleja, la afirmación
anterior es obvia: tintes o pigmentos diferentes reflejan también luz de
colores diferentes. Pero incluso cuando la fuente de luz es la sustancia
misma, es decir, cuando ésta no es un mero reflector pasivo, el color puede
depender de la composición química. Si calentamos hasta la incandescencia un
poco de sal común (un compuesto del metal sodio), se observará una luz de
tinte claramente amarillo. Los compuestos de estroncio, calentados, emiten
luz roja; los de bario, luz verde; los de potasio, luz violeta, etc. ¿Debemos
deducir de todo esto que, a pesar del efecto Doppler, la luz de las estrellas
no nos dicen nada acerca de su movimiento? Ni mucho menos. La situación es
incluso más esperanzadora de lo que cabría esperar. Examinando el espectro de
una estrella es posible deducir, no ya su movimiento, sino otras muchas
propiedades Los espectros son bastante más que un simple arco iris de
colores.
Líneas espectrales
En 1814 el óptico alemán Joseph von Fraunhofer (1787-1826) revolucionó el
estudio de los espectros. Fraunhofer era de oficio constructor de prismas de
vidrio fino y solía verificar la calidad de sus productos observando el
espectro que producían. Siguiendo los pasos del químico inglés Williarn Hyde
Wollaston (1766-1828), Fraunhofer hacía pasar el rayo de luz solar a través
de una ranura muy fina antes de que aquél atravesara el prisma. Cada longitud
de onda se refractaba con un ángulo característico, produciendo así, sobre la
pantalla en que se proyectaba la luz, una imagen de la ranura en cada uno de
los colores. Las diversas imágenes se solapaban, dando como resultado un
espectro casi continuo a modo de arco iris. Y decimos "casi continuo"
porque algunas longitudes de onda no estaban presentes en la luz solar. Estas
ausencias se manifestaban como líneas oscuras en el espectro: imágenes de la
ranura ausentes, por así decirlo. Tales líneas oscuras del espectro solar
habían sido observadas ya por Wollaston; pero con los excelentes prismas de
Fraunhofer aparecían mucho más claras y además era posible observar un número
mayor de ellas: cientos de líneas. Fraunhofer fue el primero en estudiar con
detalle estas líneas oscuras y en localizar su posición exacta en el
espectro. Por esta razón se denominan "líneas de Fraunhofer" o, con
más generalidad, "líneas espectrales".
El modelo de líneas espectrales del espectro solar es muy típico. Otros
objetos con luz propia, como las estrellas en general, exhiben también líneas
oscuras en sus espectros respectivos, pero siguiendo una pauta que a menudo
difiere de un modo marcado de la del espectro solar. No obstante, ciertas
líneas espectrales - en particular las más definidas, que Fraunhofer había
designado con las letras A a K del alfabeto - aparecían como elementos
invariables del espectro de la mayor parte de las estrellas. Midiendo el
ángulo de refracción asociado con una línea espectral concreta es posible
determinar su longitud de onda correspondiente; para ello basta medir con
exactitud la posición de la línea sobre una pantalla provista de una escala
de referencia. Si por cualquier razón la longitud de onda correspondiente a
la línea espectral se acorta, el ángulo de refracción asociado a ella
aumentará y la posición de la línea se moverá hacia el extremo violeta del
espectro. Por el contrario, si la longitud de onda se alarga, la línea se
desplazará hacia el extremo rojo del espectro.
Poco tiempo después de que Doppler explicase la variación de frecuencia de un
sonido como una consecuencia del movimiento, el físico francés Armand
Hippolyte Louis Fizeau (1819-1896) señaló que para detectar este efecto en la
luz no era preciso preocuparse de los cambios de color, sino que bastaba con
medir la posición exacta de las líneas espectrales y observar su desplaza
miento. Para aclarar esto, imaginemos una barra larga, desprovista de todo
relieve y de la cual sólo podamos ver un pequeño trozo. Si la barra se
desplaza ligeramente no cabe duda de que estaremos viendo una porción
distinta de la de antes; pero como esta nueva porción sigue careciendo de
relieve o rasgos distintivos, no podremos decir cuánto se ha desplazado la
barra, ni en qué dirección, ni siquiera si se ha movido o no. Por el
contrario, si el trozo de barra que veíamos al principio llevase una marca,
sería muy fácil detectar cualquier movimiento sin más que observar el
desplazamiento de esta señal. Esta es precisamente la explicación de por qué
las líneas espectrales permiten detectar cualquier desplazamiento Doppler en
la luz. Aquéllas vienen a ser las marcas del espectro. Puesto que Fizeau fue
quien señaló esto por vez primera, a veces se habla del "efecto
Doppler-Fizeau" en relación con la luz. El efecto es pequeño, no
obstante, y difícil de medir. El sonido se desplaza relativamente despacio -
unos 331 metros por segundo - y los trenes pueden alcanzar fácilmente
velocidades equivalentes a una décima parte de la velocidad del sonido. Las
ondas sonoras pueden comprimirse y estirarse con gran facilidad. La luz, en
cambio, viaja a 300.000.000 de metros por segundo, es decir, casi un millón
de veces la velocidad del sonido. La mayor parte de las estrellas se mueven
(en relación con nosotros) a menos de una diezmilésima de dicha velocidad, lo
cual significa que las longitudes de onda de la luz de las estrellas se ven
muy poco afectadas por el movimiento de éstas. Fue preciso esperar hasta 1868
para que el astrónomo inglés William Huggins (1824-1910) consiguiera detectar
un pequeño desplazamiento en las líneas espectrales de la brillante estrella
Sirio, demostrando que ésta se movía alejándose del Sol.
En relación con lo anterior es importante darse cuenta de que los movimientos
estelares han de visualizarse en tres dimensiones. Desde luego es posible que
una estrella se mueva en una dirección exactamente perpendicular a nuestra
línea visual o exactamente paralela a ella. Sin embargo, ambos casos son en
extremo improbables. Mucho más probable es, por el contrario, que la estrella
no se mueva ni paralela ni perpendicularmente a la línea visual, sino en
cualquiera de las direcciones intermedias. El movimiento se puede separar
entonces en dos componentes: una en la dirección de la línea de observación y
otra formando ángulo recto con ella. Gráficamente, esto se lleva a cabo
representando el movimiento real como la diagonal de un rectángulo, cuyos dos
lados adyacentes serían las dos componentes de que hemos hablado. Las
longitudes de la diagonal y de los dos lados son proporcionales al movimiento
real y a las dos componentes del movimiento, respectivamente. La componente
situada sobre la línea visual se denomina "velocidad radial",
debido a que es un movimiento hacia nosotros o alejándose de nosotros, pero
siempre a lo largo de un radio imaginario que conectase nuestro ojo con la
vasta esfera celeste. La componente perpendicular a la línea de observación
es la "velocidad transversal" (la velocidad que
"atraviesa" la línea visual). Es precisamente la velocidad
transversal la que desplaza materialmente la estrella a través de los cielos
y la que se manifiesta como el movimiento propio del objeto celeste. La
magnitud relativa de ambas componentes depende del ángulo que forme el
movimiento de la estrella con la línea visual. Y a la inversa: conociendo los
valores de la velocidad radial y de la transversal, es posible determinar la
velocidad real de la estrella.
Las dos componentes de la velocidad se calculan de modos completamente
diferentes. La velocidad radial se refleja en el espectro de la estrella en
virtud del efecto Doppler-Fizeau. Midiendo la magnitud del desplazamiento de
las líneas espectrales, se puede calcular la velocidad radial (hacia
nosotros, si el corrimiento es al violeta; apartándose de nosotros, si el
corrimiento es al rojo) directamente en kilómetros por segundo. El cálculo es
absolutamente independiente de la distancia a que se encuentre la estrella.
Las longitudes de onda de las líneas espectrales tienen unos valores fijos,
por lo cual un corrimiento dado en dichos valores delatan una velocidad
radial específica: igual da que la estrella se encuentre a cuatro años luz
que a cuatro mil. El único requisito es que la estrella sea suficientemente
brillante para que en el espectro resultante se pueda medir la posición de
las líneas.
La velocidad transversal de un cuerpo celeste no se refleja para nada en el
espectro, pero sí se manifiesta en forma de un desplazamiento material a
través de la bóveda celeste. En consecuencia, se detecta como un movimiento
propio y se mide en ángulos de arco. Si a continuación queremos convertir el
movimiento propio (en segundos de arco) en una velocidad transversal (en
kilómetros por segundo) necesitamos conocer la distancia de la estrella. Por
ejemplo, si la estrella de Barnard se encuentra a 6,1 años-luz de distancia y
se mueve a través del cielo a razón de 10,3 segundos de arco por año, su
velocidad transversal será de unos 90 kilómetros por segundo.
El centro galáctico
Llegados a este punto, podemos volver al problema de calcular la distancia de
las variables Cefeidas. Supongamos que enfocamos la cuestión desde un punto
de vista estadístico. Para aquellas estrellas que se mueven en direcciones
próximas a la línea visual, la velocidad radial es mayor que la transversal,
mientras que en el caso de aquellas otras que viajan más o menos en ángulo
recto a dicha línea, la velocidad transversal será mayor que la radial. Por
término medio, sin embargo, estas dos tendencias opuestas tienden a
cancelarse, con lo cual las velocidades radial y transversal pueden tomarse,
en general, como iguales.
Siendo esto así, el movimiento propio observado de una Cefeida (en ángulo de
arco por año) puede considerarse equivalente, no sólo a la velocidad
transversal, sino también a la radial; y la velocidad radial se puede medir
directamente, por métodos espectrales, en kilómetros por segundo. Si se
conoce la expresión de una velocidad como un cierto ángulo de arco por año y
como un determinado número de kilómetros por segundo, es posible calcular la
distancia del objeto en cuestión; pues sólo a una distancia concreta, una
velocidad de tantos kilómetros por secundo produce un desplazamiento de tal
ángulo de arco por año. Para una Cefeida concreta este tipo de cálculo puede
llegar a proporcionar un resultado disparatado, pues en un caso particular
puede ocurrir que la velocidad radial sea mucho mayor o mucho menor que la
transversal. Pero si en vez de ello tomamos cierto número de Cefeidas
pertenecientes a un mismo cúmulo, todas ellas con el mismo período, y
determinamos la distancia correspondiente a cada una de ellas, es muy
probable que la distancia media se aproxime a la realidad.
El astrónomo danés Einar Hertzsprung (1873-1967) utilizó en 1913 este método
para determinar la distancia de algunas de las Cefeidas, y varios años más
tarde Shapley aplicó esta técnica estadística al problema concreto de
averiguar la estructura de la Galaxia. Para ello calculó las distancias de
varias Cefeidas de distintos períodos; con este dato y conociendo el brillo
aparente de las Cefeidas, consiguió calcular la luminosidad de estas
estrellas. Haciendo una gráfica de las luminosidades así calculadas, en
función de los períodos, era de esperar que se obtuviese, al menos
aproximadamente, una línea recta, siempre que se prescindiese de cierta
dispersión debida a la incertidumbre intrínseca del método. Esto era lo
mínimo que se debía obtener si es que el método tenía alguna validez. Por
otra parte, si este método estadístico fuese completamente inservible, las
distancias calculadas estarían equivocadas, las luminosidades no se corresponderían,
por tanto, con la realidad y no existiría una correlación clara entre
luminosidad y período. Mas cuando Shapley trazó la gráfica
luminosidad/período, obtuvo una recta bastante aceptable, lo cual significaba
que sus resultados podían considerarse como esencialmente correctos. Y dado
que conocía tanto la luminosidad como el período de algunas Cefeidas
representativas, estaba en condiciones de determinar la distancia de
cualquiera de ellas. La escala Cefeida era ya absoluta. De este modo Shapley
pudo determinar las distancias efectivas de los distintos cúmulos globulares,
pasando luego a calcular la distancia del centro de la esfera dentro de la
cual aquéllos se encontraban distribuidos. Shapley tomó como centro de esta
esfera el centro de la Galaxia, que según sus cálculos resultaba encontrarse
a 50.000 años-luz (15.500 parsecs) del Sol.
Así, pues, hacia 1920 la posición del hombre en el Universo sufrió de nuevo
una alteración drástica y, una vez más, esta alteración se produjo en el
sentido de una mayor humillación. Copérnico había demostrado que la Tierra no
era el centro del Universo, pero nunca dudó de que el Sol ocupase dicho
centro como parte de la ordenación natural. Herschel y Kapteyn, por su parte,
habían creído que el Sol ocupaba el centro de la Galaxia (y por tanto del
Universo), al menos por accidente, si es que no por ordenación de la
naturaleza. Y ahora Shapley demostraba, de un modo perfectamente convincente,
que ello no era así, que el Sol se hallaba muy lejos en las afueras de la
Galaxia. En lugar del Universo geocéntríco de Ptolomeo y del Universo
heliocéntrico de Copérnico, teníamos ahora el "Universo excéntrico"
de Shapley, en el cual el Sol se encontraba - como la palabra misma indica -
fuera del centro.
El Universo excéntrico de Shapley planteaba, sin embargo, ciertos problemas.
Si el grueso de la Galaxia se hallaba a uno de los lados del Sol, en
dirección a la constelación de Sagitario, ¿por qué la banda de la Vía Láctea
no era muchísimo más brillante (en vez de algo más brillante) en esa
dirección que en la opuesta, donde sólo existían las últimas estribaciones de
la Galaxia? La respuesta a esta pregunta vino de la mano de la siguiente
constatación: el Universo no se agota en aquello que es perceptible para el
ojo humano. No todo lo que reluce en los cielos más allá del sistema solar es
una estrella. Existían también objetos de brillo más difuso, algunos de los
cuales habían sido registrados convenientemente por Messier, mientras que de
otros se tenían ya noticia antes de la llegada de este astrónomo.
En 1694, por ejemplo, el astrónomo holandés Chrístian Huygens (1629-1695)
incluyó en su diario la descripción de una zona brillante y difusa en la
constelación de Orión. Las regiones de estas características, cuyo aspecto se
asemeja al de una nube luminosa, recibieron el nombre de
"nebulosas" ("nebula" es nube en latín). La descrita por
Huygens es la "Nebulosa de Orión". La Nebulosa de Orión es un
objeto descomunal. Se sabe que está situada a una distancia de 1.600
años-luz; Y para que a esta distancia nosotros observemos el diámetro
aparente que vemos, el diámetro real tiene que ser de 30 años-luz. Se trata
de una ingente nube de partículas de polvo muy dispersas si lo medimos por
los patrones terrestres; en efecto, esta nebulosa es un millón de veces menos
densa que los vacíos más perfectos que podemos conseguir en el laboratorio,
pero es tan voluminosa que encierra en su interior una serie de estrellas
calientes, cuya luz refleja y dispersa. Hoy día se conocen otras muchas
nebulosas luminosas de este tipo, algunas de ellas sobremanera hermosas.
Pero así como los astrónomos se dieron cuenta de que ciertas regiones del
espacio despedían una luminosidad suave y difusa, también advirtieron la
existencia de zonas que mostraban una falta sorprendente de luminosidad.
Estudiando con detenimiento la Vía Láctea, William Herschel observó ciertas
regiones en las que existían muy pocas estrellas, aun cuando en ocasiones
estaban rodeadas por otras zonas que reventaban materialmente de ellas.
Herschel, sin complicarse la vida, interpretó estas zonas oscuras como
regiones desprovistas de estrellas, añadiendo que la Tierra estaba situada de
tal suerte que al mirar hacia los cielos se veía directamente el interior de
tales regiones vacías. "No cabe duda - dijo Herschel -, se trata de un
agujero en los cielos."
A medida que se estudió un número creciente de tales zonas, parecía menos
probable que, carentes por completo e inexplicablemente de estrellas,
pudiesen existir en cantidades tan profusas y que todas ellas estuvieran
situadas de tal modo que la perspectiva nos permitía observar el
"agujero". En 1919, E. E. Barnard había registrado ya la posición
de 182 regiones oscuras y hoy día su número se eleva a más de 350. A Barnard
y al astrónomo alemán Max Franz Cornelius Wolf (1863- 1932) se les antojaba
que estas zonas oscuras no eran simples agujeros; no fue ausencia de materia
lo que observaron, sino precisamente la presencia de ella: ingentes nubes de
partículas de polvo que absorbían y bloqueaban la luz de las estrellas
situadas detrás de aquéllas, igual que las nubes de la atmósfera terrestre
absorben e interceptan la luz del Sol.
En resumen, al lado de las nebulosas brillantes existían también
"nebulosas oscuras". Las primeras resplandecían debido a que en su
interior albergaban estrellas; las segundas eran oscuras porque tales
estrellas no existían. Entre las nebulosas oscuras más famosas figura la
"Nebulosa Cabeza de Caballo" en la constelación de Orión, que
resalta como una cabeza de caballo oscura contra el fondo luminoso de otra
nebulosa brillante. (...) Otra nebulosa oscura es el "Saco de
Carbón", una región de intensa lobreguez cerca de la Cruz del Sur. Si
las nebulosas oscuras están distribuidas de un modo más o menos uniforme a lo
largo y a lo ancho de la Galaxia, es lógico esperar que su abundancia fuese
máxima precisamente allí donde las estrellas también abundan más.
Efectivamente, la mayor parte de las nebulosas oscuras se encuentran
localizadas en el plano de la Vía Láctea y, en particular, en la dirección de
Sagitario, donde se hallan situados el centro galáctico y el grueso de la
estructura de la Galaxia. Ya vemos, pues, por qué el centro galáctico y todo
cuanto se halla detrás de él aparece oscurecido: la luz procedente de
aquellos lugares se ve interceptada permanentemente por las nubes de polvo.
Cerca del plano de la Vía Láctea existe también una región en la cual tampoco
se observan cúmulos globulares ni ninguno de los objetos distantes que son
comunes en otras porciones del cielo. Esta región se denomina "zona de
vacío". La razón de que la banda de la Vía Láctea muestre un brillo
aproximadamente igual en todas direcciones no estriba en que el sistema solar
se halle cerca del centro de la Galaxia, sino únicamente en que la mayor
parte de la luz de ésta se ve obstruida por las nebulosas oscuras. El
fragmento de Vía Láctea que se observa desde la Tierra sólo es una porción de
nuestra vecindad, por así decirlo; únicamente un extremo de la Galaxia.
Concluyendo: la idea de Shapley de que el sistema solar ocupa una posición
excéntrica en la Galaxia se mantuvo firme, a pesar de que la naturaleza de la
Vía Láctea parecía indicar que nuestro sistema ocupa una posición central.
Las dimensiones galácticas
Sin embargo, la conclusión de Shapley no era correcta en todos sus detalles.
Por primera vez en la Historia del hombre, y tras miles de años de subestimar
invariablemente el tamaño del Universo, un astrónomo sobreestimaba las
dimensiones de una porción importante del mismo. Una vez más, la dificultad
surgió en relación con lo no visible. Admitida la existencia de las nebulosas
oscuras, parece razonable preguntarse si existe alguna parte del espacio que
sea perfectamente transparente.
Establezcamos una analogía con la atmósfera. Nadie ignora que una
concentración excesiva de partículas de polvo (ya sean sólidas, como en el
humo, o líquidas, como en la niebla, bruma o nubes) puede obstruir la luz,
incluso la luz de un objeto tan brillante como el Sol. Cuando las partículas
se encuentran casi a ras del suelo (en especial en forma de niebla) la visión
resulta imposible a distancias relativamente cortas; en casos extremos, la
visibilidad se pierde a unos cuantos metros, lo cual demuestra el poder que
tienen las partículas de niebla o de humo para dispersar la luz. Parece
lógico pensar que cuando el aire está diáfano y libre de cualquier traza
visible de nubes o de bruma, será perfectamente transparente y no interferirá
para nada con la luz. Pero esto es ilusorio. Incluso en los momentos de
máxima claridad, la atmósfera no es perfectamente transparente. Siempre
dispersará algo de luz, como lo demuestra el simple hecho de que el cielo sea
de color azul (la radiación azul proviene de la luz solar dispersada). E
incluso en las noches más claras, el aire absorbe una fracción importante de
la luz sidérea que cae sobre la Tierra. Así, pues, no cabe esperar una
transparencia perfecta como no sea del vacío absoluto. El espacio
interestelar es casi un vacío perfecto: mucho más transparente - incluso en
el interior de una nebulosa - que la atmósfera terrestre, aunque no llega
tampoco a una transparencia absoluta. Y el hecho de que no sea absoluta se
debe a la presencia esporádica, aquí y allá, de una partícula de polvo en el
inmenso vacío del espacio interestelar, partícula que interceptará y desviará
ocasionalmente un rayo de luz sidérea. Tomado por separado, este efecto es
insignificante, pero en un intervalo de años-luz como el que existe de una
estrella a otra pueden intervenir un número suficiente de partículas para que
el efecto de dispersión se acumule y resulte en un fenómeno observable. El
mejor método para detectar este minúsculo efecto de dispersión se basa en el
hecho de que la luz de onda corta se dispersa con más facilidad que la de
onda larga. El proceso de dispersión elimina, por tanto, el extremo
azul-violeta del espectro, y la luz que queda es cada vez más rojiza. En
consecuencia, si se comprobara que las estrellas distantes son más tenues y
rojizas de lo normal y que este efecto aumenta continuamente con la
distancia, la presencia de polvo interestelar sería un hecho muy probable.
El primero que demostró de forma concluyente la presencia de este efecto fue
el astrónomo suizo-americano Robert Julius Trumpler (1886-1956), y lo
demostró en conexión con sus estudios de los cúmulos estelares. Tales cúmulos
poseen un tamaño medio y un brillo medio determinados, y ambos factores deben
disminuir de la misma forma, a saber, proporcionalmente al cuadrado de la
distancia. De aquí se seguía que un cúmulo globular que ocupase una extensión
dada del espacio debía poseer también un brillo determinado. En 1930 sin
embargo, Trumpler constató que la luz de los cúmulos globulares más distantes
era más tenue de lo que cabía esperar a partir de su tamaño. Y cuanto más
alejado el cúmulo, mayor era esta divergencia respecto al brillo esperado. El
área del cúmulo decrecía efectivamente de acuerdo con el cuadrado de la
distancia, pero el brillo parecía disminuir según el cuadrado de la distancia
más cierto factor atenuante adicional. Por otra parte, cuanto más distante
era el cúmulo, más rojizo era su aspecto. La manera más fácil de explicar
este fenómeno consistía en suponer que en el espacio interestelar existían
conglomerados minúsculos de polvo y que estos conglomerados ejercían un
efecto atenuante y enrojecedor a lo largo de distancias gigantescas. A lo
largo de estas distancias ingentes el polvo conseguía oscurecer y enrojecer
el brillo de los cúmulos lejanos, igual que el polvo contenido en la
atmósfera atenúa y enrojece la luz solar durante el crepúsculo. En el plano
de la Vía Láctea, donde la concentración de polvo es máxima, se estima que la
mitad de la energía de un rayo de luz se dispersa al cabo de un viaje de
2.000 años-luz; la mitad de lo que queda se elimina al cabo de otros 2.000
años-luz, y así sucesivamente. Al cabo de 30.000 años-luz (la distancia que
nos separa del centro galáctico) sólo quedaría 1/32.000 de la energía de los
rayos luminosos, aun suponiendo que no atravesara ninguna de esas
concentraciones poco usuales de polvo que son las nebulosas oscuras. No es de
extrañar, pues que resulte imposible ver el centro de la Galaxia con luz
visible. (La luz infrarroja atraviesa el polvo con más facilidad; en un punto
del cielo correspondiente al centro invisible de la Galaxia se ha conseguido
detectar una mancha infrarrojo.)
Este efecto atenuador tiene importancia en relación con las lejanas Cefeidas.
A partir del período de una Cefeida concreta se puede determinar su
luminosidad, y comparando ésta con el brillo observado se puede calcular su
distancia, puesto que es muy fácil averiguar a qué distancia se tiene que
encontrar una estrella para que su luminosidad se reduzca aparentemente a ese
simple punto de luz que se observa desde la Tierra. Ahora bien, este cálculo
descansa sobre el supuesto de que la reducción de brillo se debe única y
exclusivamente al factor distancia, cuando lo cierto es que la presencia de
polvo interestelar contribuiría a oscurecer también la luz de una Cefeida
lejana. De no ser por la presencia del polvo interestelar, la Cefeida
parecería mucho más brillante, antojándosenos, por tanto, más cercana. En
otras palabras, la existencia de este polvo (suponiendo que fuese tenida en
cuenta) induce a estimar las distancias por exceso. La estimación de Shapley,
según la cual el centro de la Galaxia se halla a 50.000 años-luz de nosotros,
se basaba en el supuesto de que las Cefeidas sólo perdían brillo por causa de
la distancia. Teniendo en cuenta la presencia de polvo interestelar como un
segundo agente atenuador, el centro de la Galaxia resulta estar a menos de
30.000 años-luz. Esto nos sigue situando lejos del centro galáctico, pero
quizá sirva de consuelo saber que sólo nos encontramos a 45 años-luz del
plano galáctico (el plano imaginario que pasa por el centro y corta la
Galaxia longitudinalmente). Esta es la razón por la cual la Vía Láctea parece
dividir el cielo en dos mitades aproximadamente iguales.
Así, pues, a principios de la década de 1930-39 se había logrado por fin
determinar las dimensiones de la Vía Láctea tal y como se aceptan hoy día. La
Galaxia es un objeto en forma de lente, de unos 80.000-100.000 años-luz de
diámetro; nuestro sistema solar está situado a unos 27.000 años-luz del
centro. El espesor de la Galaxia es de 16.000 años-luz en el centro y de
3.000 en el punto donde se halla situado el Sol. Los cúmulos globulares están
distribuidos esféricamente alrededor del centro de la Galaxia y esta esfera
de cúmulos tiene un diámetro global de 100.000 años-luz.
Por otra parte, basándose en las observaciones de las Cefeidas pertenecientes
a las Nubes de Magallanes, fue posible calcular las distancias de éstas. La
Nube Grande de Magallanes dista unos 155.000 años-luz de nosotros, y unos
165.000 años-luz la Nube Pequeña. Su posición queda indicada en la figura de
abajo; hay razones para pensar que entre ambas Nubes se extienden conexiones
débiles, de suerte que ambas formarían un único sistema. Cabe la posibilidad
de que la Nube Grande se encontrara en tiempos pasados mucho más cerca de
nosotros, y es probable que hace 500 millones de años "rozase"
nuestra Galaxia, aproximándose a unos 65.000 años-luz de su centro.
Ahora bien, el tamaño de la Galaxia no es sólo cuestión del volumen de
espacio que ocupa. ¿Cuántas estrellas contiene? Para responder a esta
pregunta, van Oort supuso que la Vía Láctea se concentra fuertemente en su
centro, de modo que la región central contuviese un 90% de todas las
estrellas de la Galaxia. En la hipótesis de que esto fuese cierto, las
estrellas situadas en las afueras de la Galaxia (nuestro Sol, por ejemplo)
girarían alrededor del centro, de la misma forma que la Tierra gira en torno
al Sol. Además, las estrellas que se encontraran más cerca del centro
galáctico girarían a una velocidad también mayor, mientras que las más
alejadas rotarían más despacio. (Esto es una consecuencia de la teoría
gravitatoria y análogo al hecho de que Mercurio, por ejemplo, que se
encuentra más cerca del Sol que la Tierra, se mueve alrededor de él a una
velocidad mayor que la de nuestro planeta, mientras que Júpiter, más lejano
que nuestro planeta, gira a una velocidad menor.)
Estas consideraciones sólo son válidas cuando las órbitas de los distintos
cuerpos que giran alrededor del centro son circulares o casi circulares, como
ocurre en el caso de los planetas del sistema solar. El análisis no sería tan
directo en el caso de estrellas cuya órbita en torno al centro galáctico
fuese muy excéntrica. Ahora bien, si tomamos en consideración un número
grande de estrellas, los efectos de la excentricidad orbital se compensarán
mutuamente. Entonces es fácil ver que las estrellas que se encuentran entre
nosotros y el centro galáctico tenderán a moverse más de prisa que nuestro
sistema: irán ganando terreno y acercándose progresivamente hacia nosotros en
dirección radial. Una vez que hayan pasado a nuestra altura, empezarán a
alejarse cada vez más (radialmente) de nuestro sistema. En cambio, las
estrellas que se encuentran más apartadas que nosotros del centro se moverán
más despacio: poco a poco les vamos ganando terreno, aproximándonos a ellas
radialmente, pasamos a su altura y nos volvemos a alejar.
Así pues, en términos generales debería existir cierta regularidad, tanto en
las velocidades transversales como en las radiales, entre las estrellas más o
menos cercanas a nosotros. Y de hecho existe. Fue precisamente esta
regularidad en las velocidades radiales lo que permitió detectar el
movimiento aparente del Sol hacia el ápex (véase pág. 76); se trata de un
movimiento menor, relativo únicamente a las estrellas más próximas. En 1904
Kapteyn consiguió extraer conclusiones de tipo más general, afirmando que
existían dos corrientes de estrellas que se movían en direcciones opuestas.
En 1925 Oort demostró que las dos corrientes de Kapteyn no eran sino las
estrellas interiores que iban ganando terreno al Sol, por un lado, y las
exteriores que iban quedando descolgadas, por otro, Oort consiguió determinar
la naturaleza de la rotación general de la Galaxia, y a partir de ahí
calcular la dirección y la distancia del centro galáctico por un método
independiente de la posición de los cúmulos globulares. Demostró que el
centro se hallaba a unos 30.000 años-luz de distancia, en la dirección de
Sagitario. Este resultado concordaba con los cálculos deducidos a partir de
los cúmulos globulares (una vez tomada en cuenta la presencia del polvo
interestelar) y esta concordancia bastó para que el modelo excéntrico de
Shapley fuese aceptado con carácter general por los astrónomos. Basándose en
el estudio de los movimientos relativos de las estrellas, Oort también logró
demostrar que el Sol gira en una órbita aproximadamente circular alrededor
del centro galáctico y a una velocidad (en relación con dicho centro) de 220
km. por segundo, completando una vuelta al cabo de 230.000.000 de años. Para
que a esa distancia la atracción gravitatoria impulse al Sol a dicha
velocidad, el centro galáctico debe tener una masa 90.000 millones de veces
superior a la del Sol, Si suponemos que el 90% de la masa de la Galaxia está
concentrada en el centro, la masa total de la Galaxia resulta ser 100.000
millones de veces superior a la del Sol.
Los estudios estadísticos de las estrellas parecen indicar que el Sol es una
estrella de masa media, por lo cual cabe especular que la Galaxia contiene unas
100.000 millones de estrellas, aun cuando ciertas estimaciones dan cifras más
altas. Teniendo en cuenta la inmensa distancia que nos separa de las Nubes de
Magallanes, vemos que la región que ocupan éstas en el espacio es bastante
respetable. El diámetro máximo de la Nube Grande quizá sea de unos 40.000
años-luz, es decir, casi la mitad del diámetro de la Galaxia. Sin embargo,
las Nubes de Magallanes tienen una Población estelar mucho menos densa que la
de nuestra Galaxia, y éste es quizá el hecho decisivo. La Nube Grande de
Magallanes seguramente no contiene más de 5.000-10.000 millones de estrellas,
ni la Nube Pequeña más de 1.000-2.000 millones. En cuanto al contenido de
estrellas, las dos Nubes juntas no suponen sino una décima parte de la
Galaxia, por lo cual cabría concebirlas como "satélites" de ésta.
Sin embargo, a pesar del menor tamaño de las Nubes de Magallanes, éstas
contienen algunos tipos de objetos que superan en tamaño y espectacularidad a
cualquiera de los que se encuentran en nuestra Galaxia (al menos en aquellas
partes que nos es dado observar). Por ejemplo, la estrella más luminosa que
se conoce, S Doradus, se encuentra emplazada en la Nube Grande de Magallanes
(la estrella se llama así porque la Nube Grande está en la constelación Dorado,
el Pez Espada). S Doradus es una estrella de octava magnitud que no posee un
brillo suficiente para ser observada a simple vista. Pero exhibir ese brillo
a una distancia como la de la Nube Grande de Magallanes supone una
luminosidad monumental. S Doradus es treinta veces más luminosa que Rigel -
la estrella más luminosa de las que se encuentran relativamente cerca de
nosotros - y unas 600.000 veces más luminosa que el Sol. La Nube Grande de
Magallanes contiene asimismo la nebulosa Tarántula, una nube de polvo
brillante, parecida a la nebulosa Orión, pero 5.000 veces mayor. La Nebulosa
Tarántula es mucho más grande y espectacular que cualquier objeto similar que
se pueda observar en nuestra Galaxia.
Ya tenemos, pues, una imagen clara de esa porción del Universo que abarca el
gigantesco cúmulo de estrellas a que pertenecemos. Si imaginamos una esfera
con centro en el punto medio de la Galaxia y un radio de unos 200.000 años-
luz, dicha esfera contendría la Galaxia entera y las Nubes de Magallanes, con
un total de 150.000 millones de estrellas, más o menos.
Cap. 12 Evolución galáctica
La cuestión de la eternidad
Como el lector habrá podido comprobar, el estudio que hemos hecho de los
problemas concernientes a la evolución estelar ha finalizado con la siguiente
idea: aunque el Sol quizá tiene una edad de sólo 5 evos [1 evo = 1.000
millones de años], antes que eso tuvo que haber una historia de la Galaxia,
pues aquél se erigió sobre las ruinas de una estrella aún más vieja. En
efecto, un examen detenido de la estructura de ciertos cúmulos globulares,
así como de la proporción entre la cantidad de hidrógeno consumida y la que
aún queda por consumir, revela que la vida de los cúmulos puede llegar a ser
de hasta 25 evos.
Ahora bien, ¿esta cifra constituye necesariamente la cota máxima? ¿Es preciso
siquiera postular una edad definida para el Universo? El hecho de que una
estrella posea una edad determinada no excluye el que antes que ella
existieran otras con su propia vida y muerte, formando así una sucesión interminable.
En este aspecto puede establecerse cierta analogía con la raza humana: la
humanidad lleva existiendo un tiempo mucho más largo que la vida de un
individuo cualquiera. En cierto modo cabe argüir, desde luego, que la energía
del Universo (incluida la materia, como una forma de energía) ha existido
desde siempre y siempre existirá, toda vez que, según los conocimientos
actuales, es imposible crear energía de la nada o destruirla por completo.
Esto significa - podríamos concluir - que la sustancia del Universo (y, por
consiguiente, el Universo mismo) es eterna. Sin embargo, no es esto a lo que
nos referimos. Lo que nos ocupa es algo más que la mera sustancia del
Universo. El problema consiste en saber si dicha sustancia siempre ha tenido
y siempre tendrá la forma que caracteriza al tipo de Universo que conocemos -
un Universo con planetas y estrellas, y capaz de albergar a seres vivientes
como nosotros mismos - o si, por el contrario, este "Universo que
conocemos" tuvo un principio perfectamente definido y tendrá un fin
también definido.
Según los conocimientos actuales, el "Universo que conocemos" (que
es al que nos referimos cuando de ahora en adelante hablemos del
"Universo") existe en su forma presente gracias a la producción de
energía suministrada por la fusión del hidrógeno. Antes de que se iniciara el
proceso de fusión habría que concebir el Universo (de acuerdo con lo expuesto
en los capítulos anteriores) como una simple masa vastísima de gas
turbulento, caliente al rojo (aunque tenuemente) en puntos aislados. Una vez
fusionado todo el hidrógeno, el Universo no podría consistir en nada más que
enanas blancas, las cuales han ido avanzando, durante períodos de tiempo
variables, a lo largo del camino que conduce en último término a la oscuridad
y a la extinción. El "Universo que conocemos" sólo se da durante el
período en que el proceso de fusión del hidrógeno se desarrolla a un ritmo
muy grande. Cuando preguntamos entonces si el Universo es eterno, lo que
estamos preguntando es, en esencia, si la fusión del hidrógeno es capaz de
perdurar para siempre.
Ahora queda explicado por qué (...) suscité la cuestión de si el Universo era
infinito, abandonando luego el tema para tomar otro rumbo y abordar el
problema de la edad de los diversos cuerpos celestes, pues ahora que nos
hemos planteado un problema similar, el de la eternidad del Universo, resulta
que ambas cuestiones están íntimamente ligadas en algunos aspectos. Por
ejemplo, si la cantidad de hidrógeno del Universo fuese infinita, es evidente
que dicho hidrógeno podría seguir fusionándose en helio indefinidamente, con
tal de que la velocidad de fusión fuese finita. Expresado con otras palabras,
un Universo finito tendría que ser también un Universo eterno. Por otra
parte, un Universo finito tal vez tendría que ser inevitablemente finito
tanto en el tiempo como en el espacio. Para que un Universo finito fuese
eterno a pesar de su finitud tendría que existir algún proceso capaz de
invertir el proceso de fusión del hidrógeno, de restablecer el nivel de hidrógeno
y de ponerlo otra vez a disposición del proceso de fusión. Además, esto no
debe ocurrir irrevocablemente a expensas de otras fuentes de energía, como
son los campos gravitatorios.
Hay que decir que a primera vista esto no parece posible. Cierto es que, de
acuerdo con la doctrina científica aceptada con carácter universal, la
energía se conserva y jamás puede ser destruida. (Este principio recibe a
veces el nombre de "primer principio de la termodinámica".) Sin
embargo, a pesar de que la cantidad de energía que nos rodea se mantiene
constante, no siempre se encuentra disponible para su conversión en trabajo
útil, y es precisamente esta disponibilidad para la transformación en trabajo
lo que constituye uno de los requisitos fundamentales del "Universo que
conocemos". En efecto, existe un principio generalizado - conocido como
"el segundo principio de la termodinámica" y que, al parecer, es
tan válido, universal e importante como el primero - que nos dice que la
cantidad de energía disponible para su conversión en trabajo decrece
constantemente. Lo cual significa, recurriendo a un ejemplo muy sencillo, que
el agua que ha discurrido ladera abajo no puede remontar la ladera por sí
sola: para ello es preciso bombearla hacia arriba a costa de la energía de alguna
otra fuente. Cualquier sistema que haya "bajado" (tanto si ha
efectuado un trabajo durante ese proceso como si no) puede recuperar su
estado original y volver a "bajar", pero siempre a expensas de
energía proveniente del exterior. Además, la energía necesaria para
restablecer un sistema que haya "bajado" es siempre mayor que la
que proporcionaría dicho sistema al volver a "bajar", con lo cual
siempre se produce una pérdida neta en el proceso de restablecimiento de un
sistema. Y según el estado actual de nuestros conocimientos, el segundo
principio de la termodinámica es inviolable.
Así pues, podemos concluir que poco a poco se irá sepultando, de modo
irrevocable, una cantidad cada vez mayor de la energía del Universo en forma
de residuos de enanas blancas: desde el punto de vista que a nosotros nos
interesa, ese será el fin del Universo. Dando marcha atrás en el tiempo,
también podríamos concluir que a pesar de que antes que el Sol existían ya
estrellas, tuvo que haber un momento - hace 25 evos, pongamos por caso - en
que toda la energía del Universo se encontrara en forma de briznas dispersas
de hidrógeno turbulento: desde nuestro punto de vista, ese sería el comienzo
del Universo. Según este razonamiento, el Universo acaso tenga una longitud
de vida de unos 1.000 evos; y de este enorme (pero finito) lapso de tiempo ha
transcurrido ya la cuadragésima parte. Ahora bien, esta conclusión descansa
en la hipótesis de que los principios primero y segundo de la termodinámica
son válidos no sólo en la pequeña porción del espacio que nos ha sido dado
inspeccionar, sino en todo punto del Universo; y no sólo en las
circunstancias que el hombre ha podido presenciar, sino en unas condiciones
cualesquiera.
Reteniendo en la memoria que la hipótesis de la validez de las leyes de la
termodinámica no es indiscutible, persistamos en nuestro intento de averiguar
sí el Universo es infinito y eterno, o, por el contrario, finito y pasajero.
A este fin conviene dejar por el momento las estrellas y centrar nuestra
atención en las galaxias.
Clases de galaxias
Las primeras nociones que aparecieron acerca de la evolución de las estrellas
nacieron del estudio de las diferentes propiedades de diversos tipos de
estrellas. Dichas propiedades fueron derivadas casi por entero a partir de
los espectros, toda vez que las estrellas en sí eran demasiado pequeñas para
exhibir detalles estructurales. El estudio de las diversas propiedades de
distintos tipos de galaxias también permiten deducir algunas nociones acerca
de su evolución. Pero existe una diferencia, y es que las galaxias son mucho
mayores que las estrellas. A pesar de que las galaxias distan mucho más de
nuestro planeta que las estrellas de nuestra vecindad espacial inmediata,
esas galaxias lejanas no aparecen a través del telescopio como simples puntos
de luz: se manifiestan como manchas luminosas con formas peculiares, y miles
de las más cercanas muestran incluso un detalle considerable.
Hubble registró las tres clases principales de galaxias: espirales,
elipsoidales e irregulares. Sin embargo, consiguió mejorar esta
clasificación, y en 1925 publicó otra, más detallada, que es la que se ha
utilizado desde entonces, Las galaxias elipsoidales, por ejemplo, que carecen
de brazos espirales y que se asemejan a cúmulos globulares muy distantes y de
gran tamaño, difieren entre sí en el grado de aplastamiento. Unas son
prácticamente esféricas (cabría llamarlas "galaxias esferoidales"),
otras son algo achatadas, otras más achatadas aún, etc. Hubble simbolizó
todas las galaxias elipsoidales con la letra E y distinguió el grado de
achatamiento por medio de números. EO representaba las galaxias esferoidales,
mientras que las clases El a E7 simbolizaban grados de aplanamiento
crecientes. Una galaxia E7 presenta un grado de aplanamiento bastante marcado,
y sus extremos (vistos de canto) sobresalen en forma de puntas como si
estuvieran a punto de convertirse en brazos espirales. En cuanto a las
galaxias espirales, Hubble distinguió dos tipos. En primer lugar estaba la
galaxia espiral ordinaria cuyos brazos van conectados directamente al núcleo
elipsoidal y empaquetados alrededor de éste, como en el caso de la galaxia de
Andrómeda. Después estaban aquellas galaxias de cuyo núcleo, y arrancando de
ambos lados de éste, parecían proyectarse hacia afuera sendas barras rectas
de estrellas. A partir de ambos extremos de las barras se extienden los
brazos espirales. Este tipo recibe el nombre de "galaxias espirales
barradas", y al parecer constituyen un 30% del número total de
espirales.
Hubble simbolizó las espirales ordinarias con la letra S, y las espirales
barradas con el signo SB. A continuación procedió a diferenciar las galaxias
espirales de ambas clases de acuerdo con el grado de apretamiento o laxitud
con que los brazos estuvieran empaquetados en torno al núcleo, utilizando a
este efecto letras minúsculas: a para los brazos empaquetados de un modo muy
apretado, y b y c para estructuras más laxas; de suerte que una galaxia
espiral podía ser del tipo Sa, Sb o Sc; o bien SBa, SBb o SBc en el caso de
que se tratara de una espiral barrada. La galaxia de Andrómeda está
clasificada como Sb. Nuestra propia Galaxia ha sido considerada, por lo
común, como similar a la de Andrómeda, clasificándola también con el símbolo
Sb. Sin embargo, es posible que haya que introducir un cambio en este punto.
Sobre la base de ciertas mediciones efectuadas en 1965 relativas al brillo de
las estrellas próximas a nuestro núcleo galáctico se sugirió que éste era más
pequeño de lo que hasta entonces se había creído. Su diámetro acaso no tenga
más de 6.500 años-luz, la mitad del diámetro del núcleo de la galaxia de
Andrómeda. Si el núcleo de nuestra Galaxia es efectivamente más pequeño de lo
que se pensaba, y los brazos espirales son, por consiguiente, más prominentes
y espaciados, nuestra Galaxia se parecería entonces más a la de Torbellino
que a la de Andrómeda, y pertenecería, igual que la primera, a la clase Sc.
Hubble nunca afirmó de un modo explícito que su ordenación representara, en
su opinión, un cambio evolutivo, pero al parecer así lo creía. La progresión
gradual desde la forma esferoidal hasta la espiral laxa constituía
ciertamente una hipótesis muy tentadora, y durante la década (más o menos)
que siguió a 1925 las ideas que predominaron en punto a la evolución
galáctica se asemejaron a una especie de hipótesis nebular laplaciana, pero a
escala mucho mayor.
Imaginemos, de entrada una cantidad de gas suficiente para formar, no ya una
sola estrella, sino cien mil millones de ellas. Dentro de esta porción
ingente de gas, que podríamos llamar protogalaxia, se operaron procesos que
condujeron en último término a su condensación en miles de millones de
estrellas. La protogalaxia dispondría en origen de cierta provisión de
momento angular, y a medida que se condensara se iría achatando. Iniciaría su
vida en forma de galaxia esferoidal, para luego aplanarse de un modo
paulatino, pasando de EO a E7. Conforme la galaxia en su totalidad continuara
contrayéndose y ganando en compacidad, la rotación iría haciéndose más rápida
y el proceso de aplanamiento más agudo, hasta llegar un momento en que -
igual que ocurría con el sistema planetario y la nebulosa de Laplace - se
desprenderían fragmentos de la zona ecuatorial. De este modo se formarían los
brazos espirales, con o sin la constitución simultánea de una barra (ni
Hubble ni ningún otro astrónomo ha sabido explicar la existencia de estas
barras). Por otra parte a medida que transcurriera el tiempo y la galaxia
siguiera contrayéndose y adquiriendo una velocidad de rotación mayor, los brazos
continuarían separándose del núcleo, de suerte que tanto las espirales como
las espirales barradas pasarían por las fases a, b y c. Las galaxias
irregulares acaso representen el estadio final de este esquema evolutivo.
Toda vez que las galaxias elípticas parecen ser especialmente grandes y las
irregulares son, por lo común, pequeñas, nos vemos obligados a suponer que
cuanto mayor es una galaxia, más despacio experimentará este proceso de
desarrollo. Las galaxias de mayor tamaño se demorarían en la fase elíptica,
mientras que las pequeñas pasarían por ella de un modo fugaz, camino de la
etapa final irregular. De ser correcto este esquema, la galaxia de Andrómeda,
y con más razón aún nuestra propia Galaxia, son relativamente viejas y se
hallan en un estadio muy avanzado del desarrollo evolutivo.
Poblaciones estelares
Sin embargo, hacía la década de 1940-49 aparecieron en escena una serie de
nuevas concepciones. En 1942 se le presentó a Baade una oportunidad
inmejorable. La ciudad de Los Angeles tuvo que ser oscurecida debido a los
bombardeos de la Segunda Guerra Mundial, y esta circunstancia permitía
obtener, con ayuda del telescopio de 100 pulgadas de Mt. Wilson, una visión
de la galaxia de Andrómeda mucho más clara que las que se habían podido
conseguir hasta entonces. Hasta aquellos momentos, Hubble y todos los
astrónomos que le siguieron sólo habían conseguido distinguir estrellas
sueltas localizadas en los brazos espirales. Baade, por el contrario, fue
capaz de observar y fotografiar astros pertenecientes al núcleo de Andrómeda.
Una importante diferencia se puso de manifiesto. Las estrellas más brillantes
de los brazos espirales eran gigantes blanco-azuladas, de gran tamaño y muy
calientes, algo así como las estrellas más brillantes de la vecindad inmediata
de nuestra Galaxia. Sin embargo, las estrellas más brillantes del núcleo de
Andrómeda eran rojizas. En esta parte de la galaxia no aparecían por ningún
lado estrellas blanco-azuladas. Esta circunstancia parecía concordar con la
información de carácter general proveniente de las fuentes espectrales. El
espectro del núcleo de Andrómeda y los de aquellos otros núcleos galácticos
que hubo ocasión de examinar, así como los espectros de las galaxias
elipsoidales en general, solían ser de la clase espectral K. La luz sidérea
media de tales regiones solía provenir de superficies más tenues y frías que
la del Sol. El espectro general de los brazos espirales de Andrómeda y de
otras galaxias se inclinaba en cambio por la clase espectral F. La luz
sidérea media de tales regiones solía provenir de superficies más brillantes
y más calientes que la del Sol. Todo ocurría como si aquellas regiones donde
las estrellas se concentraban muy juntas unas a otras - como en los cúmulos
globulares, núcleos galácticos y galaxias elipsoidales en general -
pertenecieran grosso modo a un tipo determinado que Baade llamó
"Población II", mientras que las estrellas que estaban distribuidas
de un modo más disperso, como ocurría sobre todo en los brazos espirales de
las galaxias, perteneciesen, en líneas generales, a otro tipo que dicho
astrónomo denominó "Población I". Las estrellas de la Población II
parecían estar distribuidas en una especie de halo esférico en torno al
centro galáctico, mientras que las de la Población I estaban diseminadas, al
parecer, en algo así como un disco hueco situado a lo largo del plano central
de la Galaxia. Cabría, pues, denominarlas "estrellas del halo" y
"estrellas del disco", respectivamente.
En líneas generales se puede decir que las estrellas de la Población II
suelen ser serenas y uniformes, de tamaño entre moderado y pequeño y con
cierta inclinación a ocupar regiones del espacio relativamente libres de gas
y polvo. Entre las de la Población I, por el contrario, suele figurar cierto
número de miembros bastante espectaculares y en conjunto exhiben una variedad
muy amplia que incluye estrellas grandes de brillo y temperatura mucho más
rabiosos que los de cualquiera de las estrellas de la Población II. Por otra
parte, las poblaciones estelares del tipo I ocupan regiones del espacio
relativamente ricas en gas y polvo. Esta división en dos poblaciones (que
desde entonces se ha complicado con el desglose ulterior de las Poblaciones I
y II en varias subclases) suscitó nuevas cuestiones referentes a la evolución
galáctica. El cúmulo de conocimientos que se fueron obteniendo acerca de la
naturaleza de las reacciones nucleares en el interior del núcleo central de
las estrellas parecía indicar que las estrellas grandes tenían una vida más
efímera que las pequeñas, por lo cual era preciso considerar los miembros de
la Población I como estrellas en trance de desvanecerse. Análisis más
detallados demostraron que los propios brazos espirales tenían que ser de
vida efímera, aunque hasta la fecha no se ha dado una explicación
completamente satisfactoria de por qué, si los brazos espirales tienen una
vida tan breve, existen tantas galaxias que los poseen. En cualquier caso,
existía el pensamiento de que los brazos espirales tenían que ser fenómenos
temporales y que las galaxias propendían a perderlos y a convertirse en
elípticas, y no a la inversa. Esto equivalía a invertir por completo el
esquema evolutivo de Hubble.
Supongamos que las estrellas que en un principio nacieran de una protogalaxia
constituyesen un sistema irregular, de suerte que la fase evolutiva más
temprana fuese la de una galaxia irregular. En el centro de la protogalaxia,
donde el polvo alcanza su mayor concentración, sería también donde las
estrellas se formasen más rápida y abundantemente. La porción de gas y polvo
disponible para cada estrella sería relativamente exigua, con lo cual las
estrellas del centro poseerían un tamaño pequeño y exhibirían propiedades más
bien uniformes. Una vez forzado el proceso de formación, la cantidad de polvo
y gas restante sería casi nula. Tales estrellas pertenecerían al tipo de
Población II, muy ricas en hidrógeno y muy pobres en los átomos más
complejos. Por el contrario, en las afueras de la protogalaxia el polvo y el
gas tenderían a poseer una distribución menos uniforme. La rotación general
de la protogalaxia seguramente rasgaría el polvo y el gas en jirones, de modo
que las estrellas propenderían a formarse en determinadas regiones, que
resultaron ser brazos espirales luminosos. Debido a la desigual distribución
del polvo y del gas, en unos lugares se formarían abundantes estrellas y en
otros pocas; unas dispondrían de entrada de una porción muy pequeña de
materia, mientras que otras poseerían desde el principio una cantidad mayor
que el promedio. Como consecuencia de ello, la variedad de masas sería grande
y los miembros mayores de este grupo de Población I poseerían un brillo y una
temperatura notables. Por otra parte, en los brazos espirales quedaría aún
gran cantidad de gas y polvo, ya que, dada su posición sumamente alejada del
centro, la distribución de esa materia sería demasiado dispersa para poder
servir como núcleos de estrellas. A lo largo de billones de años, ese polvo y
ese gas se irían condensando lentamente hasta que en último término fuesen
capaces de convertirse en astros. Además, las brillantes y calientes
estrellas de la Población I alcanzarían en el transcurso de su veloz
evolución la fase de "muerte" y explotarían en forma de supernovas,
suceso que vendría a enriquecer el polvo y gas de los brazos espirales con
helio y otros átomos más complejos, de modo que las estrellas de la Población
I que se formaran más tarde serían estrellas de la segunda generación,
relativamente pobres en hidrógeno y ricas en átomos más complejos.
Así pues, la primera fase de la evolución galáctica, después de la galaxia
irregular primitiva, sería una galaxia espiral de brazos muy sueltos. Pero
los brazos espírales son de vida relativamente efímera. El polvo y el gas se
consumen en el proceso de formación de estrellas, las más brillantes de éstas
se extinguen y el estado de los brazos progresa de un modo continuo desde una
situación tipo Población I a otra tipo Población II. Además, a medida que la
galaxia gira, los brazos espirales se ven arrastrados y se enrollan, por así
decirlo, alrededor del núcleo en un abrazo cada vez más apretado, pasando de
Sc a Sb y luego a Sa. En un momento dado, los brazos espirales llegan a
confundirse con el núcleo, su carácter de Población I se desvanece y queda
constituida una galaxia elíptica achatada. Las estrellas de una galaxia de
esta especie, sometidas como están a una interacción gravitatoria mutua, van
adquiriendo con el tiempo una distribución de movimientos cada vez más
uniforme a lo largo y a lo ancho del conjunto: el grado de aplanamiento va
disminuyendo hasta que, por último, se forma una galaxia esferoidal. Mirando
las cosas de este modo resultaría que nuestra Galaxia y la de Andrómeda no se
encuentran en el estadio final de su evolución, sino en las primeras fases,
siendo de hecho galaxias bastante jóvenes.
Este esquema inverso de la evolución galáctica tiene algunas observaciones a
su favor. Postula una disminución constante de polvo y gas en las galaxias
(lo cual parece razonable); las galaxias irregulares, como las Nubes de
Magallanes, son gas y polvo en un 20-50%. Al parecer, la proporción de
materias residuales que contienen es mayor que la de nuestra Galaxia
(marcadamente espiral), mientras que las galaxias espirales son a su vez más
"polvorientas" que las elípticas. A fin de explicar el gran tamaño
que caracteriza a tantas galaxias esferoidales cabría sugerir que las
galaxias grandes (igual que las estrellas grandes) evolucionan más de prisa,
y no más despacio. Las más grandes, sometidas como están a la influencia de
un campo gravitatorio particularmente intenso, se condensan más pronto en
estrellas, desarrollan antes brazos espirales en las regiones exteriores (más
abundantes también en polvo) y arrastran con mayor prontitud los brazos hacia
adentro, adoptanto la forma redondeada que exhiben hoy día las gigantescas
galaxias esferoidales. Las galaxias menores se demorarían en la etapa espiral
y las que fuesen aún más pequeñas poseerían una fase irregular (la más
temprana) sumamente prolongada. Por otra parte, también se ha pensado en la
posibilidad de que ni siquiera haya existido una evolución en el sentido
ordinario de esta expresión, es decir, un proceso en virtud del cual una
galaxia de cierto tipo se convirtiera en otra de un tipo distinto. Según esta
teoría, una vez que la galaxia adopta la forma de una estructura determinada
y llena de estrellas, dicha estructura es inamovible, y la diferencia entre
las distintas galaxias dependería por entero de diferencias inherentes a las
protogalaxias originales, sobre todo de la cantidad de momento angular
disponible. Supongamos que una protogalaxia posee muy poco momento angular.
Girará muy despacio y se aplanará de un modo no muy pronunciado, si es que
llega a aplanarse. Escasa sería también la materia que se perdería como
consecuencia del efecto centrífugo, de suerte que una protogalaxia de estas
características retendría un tamaño máximo. Las estrellas que más tarde se
formaran constituirían una galaxia esferoidal gigantesca.
Si la protogalaxia poseyera una provisión más abundante de momento angular,
giraría con una velocidad mayor, se achataría perceptiblemente,
experimentaría cierta fuga de materia en el ecuador y resultaría en una
galaxia elipsoidal algo menor y más plana que la anterior. Los cambios
cesarían de producirse en el momento en que se formasen las estrellas, y
antes de que este proceso de formación congelase definitivamente la forma de
la galaxia se registrarían grados variables de achatamiento, de acuerdo con
la cantidad de momento angular presente. En general, cuanto más achatada la
galaxia, tanto menor su tamaño. Cuando la protogalaxia disfrutase de una
cantidad particularmente grande de momento angular, un nuevo factor entraría
en escena. Se empezarían a formar estrellas, pero no a un ritmo suficiente
para eliminar todo el polvo y el gas antes de que el veloz movimiento de
rotación lograra aplanar la protogalaxia en un grado considerable. En
resumen, la masa de gas y polvo iría adoptando una estructura plana en forma
de disco, dejando tras si un halo esférico o elipsoidal de estrellas. Estas
estrellas rezagadas constituirían la Población estelar II. El disco de gas
sería lanzado hacia afuera, hacia las extremidades, y allí se concentraría;
dentro de él se formarían las estrellas de la Población I. Así pues, la
formación de las galaxias espirales y de las Poblaciones estelares tipo I
sería puramente cuestión de la velocidad de giro de la protogalaxia
original.
Sea cual fuere el esquema de evolución galáctica que adoptemos (es decir , ya
elijámosla transición de protogalaxia a galaxia esferoidal, o el de
protogalaxia a galaxia espiral y esferoidal, queda sin despejar la incógnita
general, y, por consiguiente, de la edad del Universo. ¿El Universo entero se
formó a partir de un sistema de protogalaxias que comenzaron a transformarse
en galaxias hace aproximadamente 15 evos? Si es así, entonces el Universo en
su conjunto tiene una edad de 15 evos. ¿O fue acaso que ciertas partes del
Universo iniciaron el desarrollo galáctico en un momento dado, mientras que
otras lo hicieron en otros momentos distintos? ¿Es así que la porción de
Universo con la cual estamos más familiarizados tiene una edad de 15 evos,
mientras que otras porciones son más viejas? ¿Existirán quizá vastas regiones
del espacio, indetectables para nosotros, que se hallen todavía en la fase
protogaláctica y que, efectivamente, no hayan nacido aún? Tales preguntas no
se pueden contestar apoyándonos sólo en consideraciones referentes a la
evolución galáctica. Es preciso, por tanto, abordar el problema desde otra
dirección.
Cap. 13: La recesión de las galaxias
El desvío hacia el rojo de las galaxias
En 1912 se dio un palo clave en el estudio de las galaxias; por entonces aún
no eran reconocidas como tales, sino que se pensaba que eran nebulosas
espirales dentro de nuestro propio sistema de estrellas. En dicho año el
astrónomo americano Vesto Melvin Slipher (1875-1969) midió la velocidad
radial de lo que todavía se llamaba la nebulosa de Andrómeda y comprobó que
ésta se aproximaba a nosotros (sus líneas espectrales mostraban un desvío
hacia el violeta) a una velocidad de 200 kilómetros por segundo. Fenómeno
interesante, pero no insólito. Una velocidad radial de más de cien kilómetros
por segundo era ciertamente grande, pero tampoco pasmosa. (De hecho, hoy día
sabemos que parte de dicha velocidad no cabe atribuirla a un auténtico
movimiento de aproximación de Andrómeda. Y es que da la casualidad de que la
rotación de nuestra Galaxia arrastra al sistema solar en dirección a
Andrómeda, igual que dentro de millones de años lo arrastrará alejándolo de
ella. Eliminando el efecto de esta rotación y midiendo el movimiento de
Andrómeda respecto al centro de nuestra Galaxia, resulta que aquélla sigue
aproximándose a nosotros, pero sólo a una velocidad de 50 kilómetros por
segundo.)
Hacia 1917 las cosas parecieron adquirir un tinte algo más desconcertante.
Slipher había procedido a medir la velocidad radial de un total de quince
nebulosas espirales. De antemano, y sobre una base puramente aleatoria,
cabría esperar que la mitad de ellas estuviesen acercándose y la otra mitad
alejándose de nosotros. Pero la realidad era que dos se aproximaban y trece
se alejaban. Ahora bien, aunque esta no es la situación más probable, tampoco
es imposible. (Si lanzamos al aire quince monedas, cabe esperar que
obtengamos un número más o menos igual de caras y cruces; pero el azar es el
azar, y podría ocurrir que obtuviéramos dos caras y trece cruces). Lo que sí
resultaba desconcertante es que las velocidades radiales fuesen tan grandes.
Las nebulosas que se alejaban de nuestra Galaxia lo hacían a una velocidad
media de 640 kilómetros por segundo. Una velocidad de 200 kilómetros por
segundo podía pasar, pero esos 640 kilómetros por segundo resultaban muy
difíciles de aceptar. Era una velocidad muy superior a las velocidades
radiales de las estrellas ordinarias. Y cuantas más velocidades radiales
medía Slipher dentro del grupo de nebulosas espirales, tanto más extrema se
hacía la situación, pues todas las medidas indicaban un receso, nunca un
acercamiento, y además con velocidades cada vez más pasmosas.
Cuando, hacia mediados de la década de 1920-29, Hubble demostró que los
objetos que estaba observando Slipher eran en realidad galaxias localizadas
muy lejos en las afueras de nuestra Vía Láctea, esta constatación vino en
cierto modo a aliviar el problema. Afirmar que una clase concreta de objetos
pertenecientes a nuestra Galaxia tuvieran velocidades radiales de recesión
tan grandes, mientras todos los demás objetos poseían velocidades pequeñas
que a menudo eran velocidades de aproximación, carecía completamente de
sentido. Mas si, por el contrario, los objetos que exhibían velocidades poco
usuales se hallaban también a distancias poco usuales, la situación tomaba un
cariz más favorable. Si dos propiedades de un objeto son excepcionales, es
posible que exista alguna conexión entre ambas y que una ayude a explicar la
otra.
El trabajo sobre las velocidades radiales de las galaxias fue abordado más
tarde por otro astrónomo americano, Milton La Salle Humason (n. 1891). Con un
cuidado exquisito comenzó a tomar exposiciones fotográficas de días enteros
de duración, con el fin de registrar los espectros de galaxias cada vez más
tenues. Entre las galaxias más débiles descubrió velocidades de recesión que
hacían palidecer a las observadas con anterioridad. En 1.928 midió la
velocidad radial de una galaxia llamada NGC 7619 y obtuvo un valor de 3.800
km. por segundo. Hacia 1936 estaba ya cronometrando velocidades de 40.000 km.
por segundo - más de un octavo de la velocidad de la luz - y siempre se
trataba de movimientos de recesión. Estas velocidades eran tan grandes que
los astrónomos se vieron obligados a poner en tela de juicio la naturaleza
del desvío hacia el rojo (cuestión que se sigue planteando hoy día de vez en
cuando). ¿Un desvío hacia el rojo implica necesariamente que la fuente
luminosa se está alejando? ¿O existe alguna explicación alternativa que evite
tener que aceptar velocidades tan descomunales? ¿Podría ser, por ejemplo, que
la luz de las lejanas galaxias se viera enrojecida, a lo largo de sus
prolongadas travesías, por el fino gas del espacio intergaláctico? Sin duda
alguna; pero tal enrojecimiento de la luz no coincide en absoluto con el
desvío hacia el rojo. Como consecuencia de esa difusión provocada por el gas
se iría eliminando del espectro la luz de longitud de onda corta, y la
nebulosa en su totalidad adquiriría un tinte rojizo; mas las líneas
espectrales no se desplazarían. Y es precisamente a las líneas espectrales en
particular, no al color en general, a lo que se aplica la expresión
"desvío hacia el rojo". Otra sugerencia que se ha hecho en
ocasiones es que la luz pierde de algún modo energía en el transcurso de su
largo viaje procedente de las galaxias. Cuando la luz pierde energía, dicha
pérdida se traduce en un aumento de la longitud de onda, con lo cual cabe
esperar que en tales condiciones se obtenga un auténtico desvío hacia el
rojo. De este modo, nos veríamos embaucados en la idea de que esas
velocidades inauditas con que se alejan las galaxias se deben únicamente a
que lo que nosotros estudiamos es "luz cansada". Pero esta
explicación no explica nada, porque nadie ha sido capaz hasta ahora de
concebir un mecanismo al cual cupiera atribuir la pérdida de energía
postulada. No se conoce razón alguna en virtud de la cual la luz deba perder
energía al viajar durante mucho tiempo a través del vacío. Además, suponiendo
que la luz perdiera energía de este modo, nadie sabría dar razón de su
paradero. Por otra parte, si la luz se cansa al recorrer largas distancias,
también debería cansarse, aunque en menor medida, sobre trayectos más cortos.
A juzgar por el desvío hacia el rojo relacionado con las galaxias, el desvío
producido por objetos más próximos que éstas debería ser también detectable,
pero de hecho no lo es.
En resumen: en el momento presente, el desvío hacia el rojo no puede
explicarse sino suponiendo que las galaxias se alejan de nosotros. Ninguna
otra explicación alternativa puede cuadrar con todos los hechos empíricos Y
tener a la vez algún sentido. Hasta que no se encuentre una explicación
alternativa y satisfactoria, los astrónomos no tendrán otro remedio que
seguir aceptando como un hecho la precipitada recesión de las galaxias.
Hubble, cuya labor discurría paralela a la de Humason, estaba naturalmente
interesado en esta recesión de las galaxias. Hubble había estimado, en un
trabajo minucioso y agotador, la distancia de las galaxias por diversos
caminos. En el caso de las más próximas había recurrido a las Cefeidas (véase
pág. 130). En cuanto a aquellas otras que por estar demasiado alejadas no
exhibían siquiera Cefeidas, utilizó cualquier estrella que le fuese dado
observar y supuso que se trataba de supergigantes de brillo similar al de S
Doradus, por ejemplo. En el caso de aquellas galaxias cuya distancia era
demasiado grande para poder discernir las estrellas por separado, Hubble se
apoyó en la hipótesis de que, grosso modo, todas las galaxias poseen la misma
luminosidad total y que cuanto más tenue es una galaxia, tanto mayor es su
distancia. Es decir, aplicó la ley de la inversa del cuadrado. Una galaxia
cuyo brillo fuese equivalente a un cuarto del de otra, se encontraría dos
veces más alejada que ésta; si su brillo era un noveno del de la segunda, su
distancia sería tres veces superior, y así sucesivamente. Basándose en tales
criterios de distancia, Hubble utilizó en 1929 las velocidades calculadas por
Slipher y Humason para demostrar que, en líneas generales, la velocidad de
recesión de las galaxias aumentaba. proporcionalmente con la distancia que
nos separa de dichas galaxias. Una galaxia que se hallara dos veces más
alejada de nosotros que otra retrocedería a una velocidad doble que la de
ésta; si se hallara tres veces más alejada que la segunda, su velocidad de
recesión sería también tres veces mayor, etc. Esta es la "ley de
Hubble".
La característica más desconcertante de la ley de Hubble - la velocidad de
recesión de una galaxia es proporcional a la distancia que la separa de
nosotros - se puede expresar con una pregunta muy sencilla: ¿Por qué
precisamente de nosotros? ¿Qué magia tenemos para que las galaxias nos
rehuyan? ¿Y cómo saben las galaxias a qué distancia se hallan de nosotros
para guiar sus pasos de un modo acorde? Afortunadamente, el mismo
razonamiento que explica la relación entre la velocidad de recesión y la
distancias, explica también por qué dicha distancia debe ser una distancia a
partir de nosotros. La explicación fue sugerida por la nueva concepción del
Universo presentada por Einstein.
Relatividad
La nueva concepción estaba contenida en la teoría general de la relatividad,
publicada por Einstein en 1915. En esta teoría Einstein planteaba un conjunto
de "ecuaciones de campo" que describían las propiedades generales
del Universo. A este fin supuso que el Universo, a pesar de que presentaba
aquí y allá condensaciones de materia (planetas, estrellas, galaxias), podía
ser estudiado con una precisión razonable considerándolo como si todo él
estuviera lleno uniformemente de materia, es decir, como si la materia que de
hecho existe en el Universo se hallara distribuida de un modo regular en toda
su extensión. (Esto es análogo a lo que hicieron los hombres de la
Antigüedad: suponer que a pesar de que la superficie terrestre es, a todas
luces, desigual e irregular, tales irregularidades no son realmente
importantes y que, en líneas generales, cabe considerarlas como distribuidas
uniformemente; pensar, por tanto, que el mundo es plano. Esto mismo es lo que
hacemos hoy día, con la única diferencia de que consideramos la Tierra como
una esfera.)
Einstein supuso además que las propiedades del Universo eran, en líneas
generales, las mismas en cualquier punto. Si aceptamos esta hipótesis como
base, el número de posibles geometrías del Universo estaba estrictamente
limitado. Con el fin de ver en qué se apoya esta afirmación, utilicemos la
superficie de la Tierra como analogía. Cualquiera que sea el punto de la
Tierra donde nos encontremos, la situación es prácticamente la misma, en el
sentido de que las direcciones arriba y abajo son idénticas, la atracción de
la gravedad es más o menos igual y el horizonte se halla siempre a la misma
distancia, independientemente de la dirección que consideremos (suponiendo
que hacemos caso omiso de las irregularidades locales de la superficie y que
consideramos toda la materia distribuida de modo uniforme). Existen tres
tipos de superficie que la Tierra pudiera tener y que resultarían en
propiedades locales idénticas (de la especie que hemos indicado
anteriormente) en todo punto. La Tierra podría ser plana, o esférica, o
poseer una forma mucho menos común llamada "pseudoesférica". Los
hombres de la Antigüedad supusieron que la superficie era plana porque esta
era la forma más simple, pero las observaciones empíricas obligaron más tarde
a inclinarse por la forma esférica. La elección de la superficie esférica
para la Tierra, en lugar de cualquiera de las otras formas, trae consigo una
importante consecuencia geométrica. De las tres superficies, la esférica es
la única finita. Una línea recta trazada sobre una superficie plana - o bien
el equivalente de una línea recta trazada sobre una superficie pseudoesférica
- se podría prolongar sin fin. Una recta trazada sobre una superficie
esférica acabaría en cambio cerrándose sobre sí misma. Quiere decirse que si
comenzamos en un punto determinado del Ecuador y empezamos a andar hacia el
Este, llegará un momento en que regresaremos al punto de partida, a pesar de
no haber cambiado nunca de dirección. Podemos caminar indefinidamente sin
llegar nunca al "fin de la Tierra", pero estaremos repitiendo una y
otra vez el mismo recorrido. La superficie de una esfera es finita, pero
ilimitada. La misma situación puede aplicarse al Universo en si, conjunto,
con la salvedad de que entonces se trataría de un volumen y no de una
superficie, lo cual hace que el problema resulte más difícil de visualizar.
Consideremos, sin embargo, un rayo de luz que viaje a través del Universo. A
primera vista parece lógico pensar que un rayo de luz que atraviese un vacío
perfecto y que no tropiece con campos de energía que interfieran con él,
debiera viajar en una línea absolutamente recta para siempre, alejándose de
su fuente a una velocidad constante. Esto es equivalente a decir que el
Universo tiene aquellas propiedades que uno describiría por medio de la
geometría euclidiana. Así pues, diríamos que es un "Universo
plano", a pesar de que no se trata de una superficie, sino de un
volumen. Ahora bien, ¿el Universo es realmente euclidiano o es esto una mera
ilusión producida por el hecho de que sólo podamos ver una porción muy
pequeña de él? Si observamos una porción exigua de la superficie terrestre
también nos da la sensación de ser plana, y sólo mediante cálculos muy
delicados podemos llegar a saber que en realidad se curva suavemente en todas
direcciones. Pero si el Universo no es euclidiano ¿qué podrá ser entonces?
Suponiendo que sus propiedades generales son idénticas en todos sus puntos,
dispondremos de las mismas posibilidades que teníamos en el caso de la
superficie terrestre, siempre que consideremos el problema en función de un
rayo de luz. Dos son, pues, las variantes a la hipótesis "plana",
correspondientes a dos variedades de un Universo no-euclidiano. El rayo de
luz puede describir un grandioso círculo, como si se moviera sobre la superficie
de una esfera. La geometría del Universo correspondería entonces a un sistema
que fue descrito en origen por el matemático alemán Georg Friedrich Bernhard
Riemann (1826-1866) en el año 1854. Un universo riemanniano no debe ser
considerado simplemente como un Universo esférico, pues es mucho más
complicado. Es un Universo en el cual el espacio tridimensional mismo se
curva en todas direcciones con una curvatura constante. El Universo sería la
contrapartida tetradimensional de una esfera: una "hiperesfera",
algo muy difícil de representarse o de imaginar, acostumbrados como estamos a
pensar en tres dimensiones. El rayo de luz también podría moverse como si se
desplazara sobre una superficie pseudoesférica en todas las direcciones. La
geometría del Universo correspondería entonces a un sistema descrito en
origen por el matemático ruso Nikolai Ivanovich Lobachevski (1793-1856) en el
año 1829. El Universo riemanniano difiere del euclidiano y del lobachevskiano
en que es finito. Un rayo de luz que viaje a través de un Universo
riemanniano se curvaría y regresaría a su punto de partida. Podrá seguir
viajando sin fin, pero sólo a costa de repetir una y otra vez su recorrido,
como ocurría en el ejemplo del periplo a lo largo del ecuador terrestre.
Dicho con otras palabras, el Universo riemanniano es finito pero ilimitado.
¿Cómo haremos para elegir entre estas tres posibilidades? Si fuésemos capaces
de hacer que un rayo de luz viajase una distancia suficientemente larga,
quizá podríamos comprobar si efectivamente la trayectoria era recta, o si se
desviaba de la línea recta, ya fuese de una manera riemanniana o
lobachevskiana, El Universo se aparta tan poco del prototipo euclidiano
(suponiendo que se aparte siquiera) que sería muy difícil trabajar con un
rayo de luz lo bastante prolongado como para servir a este propósito. Y lo
que es peor: nuestra busca en pos de la "rectitud" se vería
obstaculizada por el hecho de que nuestro criterio de rectitud es la propia
luz. En efecto, si tenemos una larga regla graduada y queremos saber si es
recta o no, podemos sostenerla en prolongación con uno de los ojos y mirar a
lo largo de ella. Si la regla no es recta, observaremos que ésta se hunde en
ciertos lugares por debajo de la línea visual, o que sobresale por encima de
ella, o que se curva a un lado o a otro; de este modo, es posible detectar al
instante desviaciones mínimas. Pero lo que estamos haciendo en este caso es
suponer que los rayos de luz viajan en líneas completamente rectas. Esta
hipótesis relativa a la rectitud de la luz es tan absoluta que cuando la luz
se refleja o se refracta, nada podrá convencer a nuestro sentido de la vista
de que la rectitud ha sido violada: nos veremos detrás del espejo; tenemos la
sensación de que un bastón sumergido en el agua se dobla bruscamente en el
punto de contacto con la superficie, etc.
La decisión entre los posibles Universos hay que tomarla, por consiguiente,
de un modo más indirecto. Einstein eligió el Universo riemanniano y para 1917
había deducido ya sus consecuencias, tratando de hallar alguna que se
apartase sensiblemente de las correspondientes euclidianas o lobachevskianas.
(Esto cabe considerarlo como el comienzo de la moderna ciencia de la
cosmología.) Einstein demostró, por ejemplo, que en un Universo riemanniano
la luz perdería energía al desplazarse contra la fuerza de un campo
gravitatorio: el "desvío de Einstein" que este físico predijo fue
detectado en la luz radiada por Sirio B. Asimismo predijo que los rayos
luminosos se curvarían al pasar junto a un objeto masivo, con lo cual
parecería que las estrellas cambian ligeramente de posición cuando la luz
emitida por ellas pasa al lado del Sol. Durante el eclipse total de 1919 se
midió la posición de las estrellas "cercanas" al Sol, comparándola
luego con la posición que ocupaban cuando el Sol no se hallaba cerca, y de
nuevo se comprobó que Einstein tenía razón. La teoría general de la
relatividad de Einstein ha salido airosa de todas las pruebas a las que ha
sido sometida. No existe una sola observación que la contradiga abiertamente.
Hoy día los astrónomos aceptan con carácter general que el Universo en
conjunto obedece a una geometría riemanniana, aun cuando esta geometría se
desvía tan poco de la euclidiana que en condiciones ordinarias la geometría
euclidiana resulta perfectamente satisfactoria.
Por otra parte, Einstein concebía este universo riemanniano como estático, es
decir, que no experimentaba cambios globales. Sus componentes individuales se
mueven de un lado para otro, pero si fuese posible distribuir uniformemente
toda la materia, su densidad global permanecería constante. Toda vez que,
según la concepción de Einstein, la curvatura del Universo (la medida en que
era riemanniano) dependía de la densidad, un rayo de luz libre de toda
influencia exterior viajaría en un círculo perfecto. Sin embargo, el
astrónomo holandés Willem de Sitter (1872-1934), que había sido uno de los
primeros en aceptar la teoría de la relatividad, sugirió en 1917 otro diseño
del Universo que también se ajustaba a las ecuaciones de campo de Einstein.
Se trataba de un Universo vacío y en continua expansión, lo cual venía a
significar que la curvatura del espacio se hacía cada vez menos marcada. El
Universo era riemanniano, pero cada día se aproximaba más a uno de tipo
euclidiano (límite que alcanzaría cuando la expansión se hiciese infinita).
En el modelo del Universo de de Sitter, un rayo luminoso no seguiría una
circunferencia, sino una espiral en continua expansión. Por otra parte,
supongamos que introdujésemos (mentalmente) dos partículas en el Universo en
expansión de de Sitter. Las dos partículas se alejarían al instante y
seguirían separándose a medida que el espacio que media entre ellas se fuese
expandiendo más y más. Si en vez de dos partículas dispersáramos un gran
número de ellas a lo largo y a lo ancho de este Universo, la expansión
general se traduciría en un aumento de la distancia entre cualesquiera dos
partículas. Si la separación entre una partícula determinada y su vecina más
próxima era de 1 año-luz al comienzo, dicha distancia sería de 2 años-luz al
cabo de cierto tiempo, de 3 años-luz algo más tarde, etc. Supongamos ahora
que sobre una de esas partículas viaja un observador encargado de vigilar a
las demás. En una dirección concreta habría, por ejemplo, una partícula a 1
año-luz de distancia, otra algo más allá a 2 años-luz, una tercera a 3
años-luz, etc. Al cabo de un siglo, pongamos por caso, la distancia entre
cualesquiera dos partículas vecinas habrá aumentado hasta dos años-luz. Para
entonces, nuestro observador, sentado en su partícula y mirando en la misma
dirección que antes, vería que la partícula más cercana se halla a 2
años-luz, y así sucesivamente. En ese caso, la partícula más próxima se ha
movido de 1 año-luz a 2 años-luz, alejándose a una velocidad de 1 año-luz por
siglo. La segunda partícula se ha movido de una distancia de 2 a otra de 4
años-luz, alejándose con una velocidad de 2 años-luz por siglo. La tercera se
ha desplazado de 3 a 6 años-luz, alejándose a una velocidad de 3 años-luz por
siglo. Todas las partículas que ve el observador en una dirección particular
se estarán alejando de él y además a una velocidad proporcional a su
distancia. Naturalmente, esto es cierto cualquiera que sea la dirección en
que se mire. ¿Quiere decir esto que la partícula del observador sea una
partícula especial? En absoluto, pues lo mismo ocurriría con cualquier otra.
El efecto sería idéntico. Todas y cada una de las partículas de un universo
de esta especie se estarán alejando de todas y cada una de las demás
partículas con una velocidad proporcional a la distancia que separa a ambas.
Desde un punto de vista teórico, el Universo en expansión de de Sitter
parecía bastante superior al Universo estático de Einstein. Esta superioridad
se vio fortalecida aún más en 1922 a manos del astrónomo ruso Alexander
Friedman, quien aplicó dicha teoría a un Universo no vacío. Más tarde, en el
año 1930, Eddington consiguió demostrar que aun en el caso de que fuese
lícito suponer que el Universo estático de Einstein existe, tal Universo sería
inestable, igual que un cono colocado sobre su vértice. Si por cualquier
razón se empezara a expandir, aunque fuese muy ligeramente, seguiría
expandiéndose indefinidamente; del mismo modo que si comenzara a contraerse,
continuaría haciéndolo indefinidamente.
Cúmulos de galaxias
Así pues, la ley de Hubble parece indicar (en función del Universo real) que
el modelo teórico de de Sitter de un Universo en expansión es correcto. Las
galaxias se alejan unas de otras no porque cada una de ellas se encuentre en
movimiento, sino debido a que el espacio en su totalidad se está expandiendo.
Como resultado de esta expansión, la velocidad de recesión de una galaxia
particular es proporcional a la distancia que la separa de nosotros. Por otra
parte, el hecho de que nuestra Galaxia parezca constituir el punto central de
esta fuga universal se debe únicamente a que observamos el Universo
precisamente desde ese punto. Si nos encontráramos en la galaxia de
Andrómeda, o en cualquier otra, observaríamos el mismo fenómeno, y la galaxia
en que nos hallásemos parecería constituir el punto central.
Naturalmente, cabe ahora argüir que si el Universo se encuentra de hecho en
proceso de expansión, entonces todas las galaxias, sin excepción, deberían
alejarse de las demás, lo cual es casi cierto, pero no del todo, y con
"casi cierto" no se gana ningún premio. Por ejemplo, la galaxia de
Andrómeda no se aleja de nosotros, sino que se aproxima. Cierto que a una
velocidad muy lenta, pero ello no quita para que se trate de un movimiento de
aproximación. Esto parece dar al traste con la idea de un Universo en
expansión. En realidad no es así. Al presentar un modelo del Universo, por
fuerza hay que hacer hipótesis simplificadoras, pues de otro modo las
complejidades del modelo adquieren tales proporciones que impiden analizarlas
o describirlas. En el modelo de de Sitter, por ejemplo, se supone que las
partículas de prueba no ejercen ninguna fuerza mutua, sino que se dejan
arrastrar por el movimiento expansivo del Universo sin oponer resistencia.
Pero en realidad esto no es así. En el Universo existen fuerzas de gran
alcance capaces de hacerse notar a grandes distancias en el momento que se
introduce la materia. Estas fuerzas que actúan a grandes distancias son de
dos tipos. Existen campos electromagnéticos y campos gravitatorios. El campo
electromagnético da origen a fuerzas de dos clases: una atractiva y otra
repulsiva; a gran escala ambos efectos se compensan. Así pues, es posible
ignorar el campo electromagnético cuando nos ocupemos del Universo en su
totalidad. No sucede lo mismo con el campo gravitatorio. Este da lugar a un
único tipo de fuerza, que es atractiva. Dos objetos cualesquiera localizados
en el Universo - incluso en un Universo en expansión - se atraen mutuamente
Cuanto más próximos se hallen, tanto más fuerte será la atracción
gravitatoria mutua y tanto más probable será que los dos se aferren uno al
otro, por así decirlo, en contra de la influencia disgregadora de la
expansión del Universo. El Universo en expansión no separa, por ejemplo, los
distintos componentes del sistema solar, ni aleja unas de otras las diversas
estrellas de una misma galaxia. Dicha expansión no bastará tampoco para
separar a dos o más galaxias que se hallen suficientemente próximas unas de
otras para estar atrapadas en las redes de un campo gravitatorio mutuo
suficientemente fuerte.
En resumen, las "partículas independientes" que se disgregan en un
Universo en expansión no son necesariamente, en nuestro Universo real,
galaxias individuales, sino grupos particulares o cúmulos de galaxias. No
cabe duda que tales cúmulos existen. Se conocen varios casos en que dos o más
galaxias interaccionan de un modo patente, están encerradas dentro de halos
comunes o se hallan conectadas por medio de hilos luminosos. La causa de la
interacción puede ser gravitatoria o electromagnética, pero el caso es que
tal interacción existe; en consecuencia, resulta muy lógico tratar esas
galaxias como una unidad, hablando desde el punto de vista general del
Universo. Nuestra propia Galaxia tiene firmemente en su puño, en calidad de
galaxias satélites, a las dos Nubes de Magallanes (existen pruebas incluso de
que entre éstas y nuestra Galaxia flotan minúsculas briznas de gas) y no es
probable que estas Nubes se vean separadas de nosotros como resultado de la
expansión del Universo. De igual modo, la galaxia de Andrómeda (M31) posee
dos pequeñas galaxias (M31 y M33) en calidad de satélites. Dando un paso más
es posible considerar la galaxia de Andrómeda y la nuestra propia como los
dos miembros gigantes de un grupo compuesto en total por unos doce miembros.
Este grupo es el denominado "Grupo Local", y no cabe duda que
mantendrá su identidad - al menos durante un período bastante largo - en
contra de la fuerza expansiva del Universo. Los movimientos de las galaxias
del Grupo Local no reflejan la expansión general del Universo, sino más bien
las fuerzas gravitatorias locales. Esta es la razón de que la galaxia de
Andrómeda se aproxime (al menos hasta ahora) hacia nosotros.
El número de cúmulos de galaxias visibles en el cielo asciende a centenares.
Y se trata evidentemente de cúmulos porque los distintos miembros se hallan
muy cerca unos de otros en el espacio y porque todos los miembros mayores
exhiben una luminosidad similar. Algunos cúmulos son enormes. Existe uno en
la constelación Coma Berenices, a una distancia de 120.000.000 de años-luz
aproximadamente, que está compuesto de unas 10.000 galaxias. Tales cúmulos
resultan de extrema utilidad a la hora de estimar distancias. Si se estudian las
galaxias una a una, no es del todo lícito suponer que el grado de tenuidad
viene determinado exclusivamente por la distancia, pues existen galaxias
gigantes y galaxias enanas, igual que existen estrellas gigantes y estrellas
enanas. La galaxia de Andrómeda y sus dos galaxias satélites se encuentran a
la misma distancia de nosotros, y sin embargo la primera es mucho más
brillante que cualquiera de las segundas, debido sencillamente a que aquélla
es una gigante mientras que éstas son enanas. Cabría argüir, desde luego, que
a la larga tales diferencias de tamaño se compensan y que, considerando la
situación de un modo global y desde un punto de vista estadístico no
demasiado severo, la tenuidad puede tomarse como proporcional a la distancia.
Esto es cierto, pero como consecuencia de ello la ecuación general
tenuidad-distancia se ve afectada entonces de irregularidades. En cambio,
tratándose de cúmulos se puede suponer que los miembros más brillantes son
galaxias gigantes equivalentes a la de Andrómeda o a la nuestra propia, y
que, por consiguiente, poseen una luminosidad total equiparable a una
magnitud absoluta de -19 o -20. Seguirá existiendo la posibilidad de que
surjan diferencias o irregularidades entre un cúmulo y otro, pero, según la
opinión de los astrónomos, éstas serán mucho más pequeñas que las que
aparecerían si se trabajara con galaxias individuales.
Así pues, los astrónomos estiman más seguro juzgar la distancia de los
cúmulos de galaxias a partir únicamente de la tenuidad, pasando luego a comparar
dicha distancia con el valor del desvío hacia el rojo con el fin de comprobar
si la ley de Hubble se cumple (de hecho se cumple). Haciendo uso de este
método se ha estimado que cierto cúmulo de galaxias localizado en la
constelación Virgo se encuentra quince veces más alejado que la galaxia de
Andrómeda; otros cúmulos se hallan a una distancia casi mil veces superior a
la de Andrómeda.
Cap. 14. El Universo observable
De nuevo la paradoja de Olbers
La escala del Universo es tan descomunal que a su lado empalidece incluso la
distancia de las galaxias más próximas, tal como la de Andrómeda. Cuando se
determinó por primera vez la distancia de la galaxia de Andrómeda y empezaron
a barajarse cifras de "cientos de miles de años-luz", parecía que la
imaginación no podía ya dar más de sí. Sin embargo, al cabo de una década,
más o menos, hubo que convencerse de que Andrómeda se hallaba, como quien
dice, a la vuelta de la esquina. Tanto es así que forma parte, como ya hemos
dicho, del Grupo Local, de un sistema al cual también nosotros pertenecemos.
De nuevo nos vemos obligados a preguntarnos dónde está el fin. Una y otra vez
el hombre se ha visto precisado a ampliar su visión del Universo con el fin
de dar cabida a grupos cada vez mayores. Alrededor de una estrella se agrupan
pequeños objetos no luminosos para formar un sistema planetario. Las
estrellas se apiñarían a su vez para constituir un sistema multiestelar
simple, o cúmulos abiertos de mayor tamaño, o incluso cúmulos globulares aún
más grandes, o bien galaxias que superan en magnitud a todos los anteriores.
Las galaxias se agrupan para formar cúmulos de galaxias. ¿Es posible que
éstos se asocien a un nivel todavía superior y formen lo que cabría llamar
cúmulos de cúmulos de galaxias? De Vaucouleurs opina que ello es posible, que
hay indicios de que acaso exista una "supergalaxia" de la cual el
Grupo Local no constituya sino una pieza muy pequeña. Si el análisis de este
astrónomo es correcto, significaría que nos encontramos a decenas de millones
de años-luz del centro de dicha supergalaxia; y más allá de ésta, en
cualquier dirección, existirían otras supergalaxias.
¿Y no podría haber cúmulos de supergalaxias y cúmulos de cúmulos de
supergalaxias, etc.? ¿Dónde estaría el límite? ¿Tiene que existir necesariamente
un fin? ¿No será que nos encontramos ante un Universo infinito? Un sistema
tal compuesto por una secuencia interminable de cúmulos de cúmulos recibe el
nombre de "Universo jerarquía" y fue sugerido en origen por el
astrónomo sueco Carl Wilhelm Ludwig Charlier (1862-1934). Ahora bien, no
olvidemos que si aceptamos la teoría de la relatividad de Einstein, entonces
su Universo riemanniano debe tener un volumen finito. Aun hallándose en
proceso de expansión, ese volumen finito que se halla en continuo crecimiento
tiene que permanecer finito. Y sin embargo, a veces se argumenta que aunque
el Universo posea un volumen finito, podría ser capaz de albergar un número
infinito de galaxias. En ese caso, el sistema de cúmulos de cúmulos de
cúmulos de cúmulos de galaxias puede continuar, sin tasa, adquiriendo un
grado cada vez mayor de complejidad. Pero si estamos dispuestos a considerar
la posibilidad de un número infinito de galaxias, ¿no desembocaremos de nuevo
en la paradoja de Olbers? (véase pág. 66). La existencia de un número
infinito de galaxias en cualquier dirección ¿no suministraría a la Tierra una
cantidad infinita de luz? Y el hecho de que la Tierra no recibe una cantidad
infinita de luz ¿no significa que el número de galaxias tiene que ser finito?
En efecto, si el Universo riemanniano fuese estático, como sugiriera Einstein
en principio, habría que concluir que el número de galaxias es finito. En un
Universo estático, el razonamiento que más adelante expondremos en favor de
la posibilidad de un número infinito de galaxias no sería válido. En un
Universo de esas características, tanto el volumen como el número de galaxias
serían finitos y la paradoja de Olbers no plantearía ningún problema. Mas, al
parecer, vivimos en un Universo en expansión, y en él sí puede valer el
argumento que aboga por un número infinito de galaxias. ¿Qué hacer entonces?
¿Cómo nos deshacemos del maleficio de la paradoja de Olbers?
En un Universo en expansión en el que las galaxias se alejan constantemente
unas de otras existe un nuevo factor a tener en cuenta, un factor que se
hallaría ausente si el Universo fuese estático y las galaxias se mantuvieran
a distancias constantes (por término medio). Ese nuevo factor es el desvío
hacia el rojo. En un Universo en expansión, la luz emitida por las galaxias
se debilita y atenúa por causa del desvío hacia el rojo. Cuanto más lejana es
la galaxia, tanto mayor es dicho desvío y tanto más pronunciado es el
debilitamiento de la energía total de radiación que llega hasta nosotros.
Teniendo en cuenta este debilitamiento constante de la radiación que llega
hasta nosotros desde distancias cada vez más grandes, se puede demostrar que
la cantidad total de radiación que incide sobre la Tierra tiende a cierto
valor finito, que, por lo demás, tampoco es excesivamente grande, aun en la
hipótesis de que el número de galaxias sea infinitamente grande. La paradoja
de Olbers no constituye obstáculo alguno para el Universo infinito (la
infinitud se refiere aquí al número de galaxias) siempre que dicho Universo
se encuentre en expansión. Esto quizá suene imposible. El lector dirá que si
cada una de las galaxias de un conjunto infinito contribuye con su granito de
radiación, la suma total tendrá que ser infinita, independientemente de la
pequeñez de esa contribución. Esto equivale a decir que la suma de una serie
infinita de números tiene que ser infinita, por pequeños que sean los números
de la serie. Razonamiento que seguramente parece muy lógico, pero que no deja
de ser erróneo, como puede demostrarse fácilmente. (...)
En la descripción original de la paradoja de Olbers señalamos que en el caso
de un Universo infinito del tipo que Olbers concebía, cada una de las capas
del espacio suministra a la Tierra una cantidad igual de luz. Si la luz
proveniente de una de las capas se toma igual a 1, entonces la luz total de
todas las capas es 1 " 1 " 1 " 1... y así sucesivamente hasta
siempre. Esta es una "serie divergente" y su suma es infinita. Esta
suma infinita constituye precisamente el meollo de la paradoja. Ahora bien,
si tenemos en cuenta el desvío al rojo, vemos que cada capa (progresando de
dentro afuera) suministra menos luz que la anterior. La serie correspondiente
converge y proporciona una suma finita. En el Universo riemanniano de
Einstein podemos olvidarnos de la paradoja de Olbers, pues no supone ningún
problema. Mas ahora se plantea otra cuestión. Si estamos dispuestos a
considerar el desvío hacia el rojo y el consiguiente debilitamiento
progresivo de la energía de radiación de galaxias cada vez más distantes,
deberemos preguntarnos, no qué tamaño tiene el Universo, sino qué porción de
él nos es dado observar. El hombre ha dado por supuesto que perfeccionando
sus instrumentos y refinando sus técnicas - es decir, si construye
telescopios mayores y espectroscopios más perfectos y cámaras fotográficas
más delicadas - estará en condiciones de escudriñar lugares cada vez más
recónditos del espacio. Pero ¿es cierto esto? Si la radiación de las lejanas
galaxias se atenúa progresivamente, ¿no existirá un punto a partir del cual
la radiación se debilite tanto que ningún instrumento por muy próximo que se
halle a la perfección, pueda detectarla? Si tal punto existiera, el tamaño
del Universo que nos es dado observar poseería, en principio, un límite; algo
así como una frontera exterior más allá de la cual sería imposible escrutar.
Esta frontera acotaría lo que cabe denominar el "Universo
observable". Con el fin de averiguar si tal límite inviolable existe y
dónde podría estar localizado, volvamos a la ley de Hubble.
La constante de Hubble
La ley de Hubble afirma que la velocidad de recesión de una galaxia es
directamente proporcional a la distancia que la separa de nosotros. Quiere
decirse que si multiplicamos dicha distancia por cierta cantidad (la
"constante de Hubble"), el producto será igual a la velocidad de
recesión. Expresemos la distancia en millones de años-luz y llamémosla D. La
velocidad de recesión podemos representarla en kilómetros por segundo y
llamarla V. Por último, sea k la constante de proporcionalidad. La ley de
Hubble se puede expresar entonces de la manera siguiente V = kD. Puesto que
todo depende del valor de k, transformemos la ecuación anterior, utilizando
técnicas algebraicas muy simples: k = V/D, lo cual nos dice que k debe ser
igual a la velocidad de recesión de una galaxia (en kilómetros por segundo)
dividida por su distancia (en millones de años-luz). El valor de k se podrá
obtener siempre que dispongamos de datos precisos y fiables para la distancia
y la velocidad de recesión de una sola galaxia o grupo de galaxias. Si Hubble
está en lo cierto, el valor de k así obtenido será válido para todas las
galaxias. Consideremos, por ejemplo, el cúmulo de Virgo. El desvío hacia el
rojo de sus componentes revela que dicho cúmulo se aleja de nosotros a una velocidad
de 1.142 kilómetros por segundo. Comparando el brillo de las galaxias más
brillantes del cúmulo con el de la galaxia de Andrómeda, llegamos a la
conclusión de que aquél se halla 16,5 veces más alejado que Andrómeda. Por
consiguiente, si la galaxia de Andrómeda se encuentra a 800.000 años-luz de
nosotros (de acuerdo con la relación período-luminosidad de las Cefeidas;
véase pág. 83), el cúmulo de Virgo tiene que hallarse a 16,5 x 800.000 ó
13.000.000 de años-luz de distancia, aproximadamente. Para hallar ahora el
valor de k, tenemos que dividir la velocidad de recesión de Virgo (en
kilómetros por segundo) por la distancia que lo separa de nosotros (en
millones de años-luz). El resultado es k = 1142/13, o aproximadamente 88. Así
pues, cabe esperar que una galaxia que se halle a 1.000.000 de años-luz de
distancia se aleje de nosotros a una velocidad de 88 km. por segundo; que
otra que se encuentre a 2.000.000 de años-luz huya de nosotros a 176 km. por
segundo; que una tercera que se halle a 10.000.000 de años-luz se aleje a 880
km. por segundo, etcétera. ¿Tendrá este proceso algún límite, suponiendo,
claro está, que la ley de Hubble sea exacta para cualquier distancia? Desde
el punto de vista matemático no existe límite alguno. Una galaxia que se encuentre
a 1.000 millones de años-luz se alejaría a una velocidad de 88.000 kilómetros
por segundo; otra que se halle a 1.000.000 de millones de años-luz
retrocedería a 88.000.000 de kilómetros por segundo, y así sucesivamente.
Ahora bien, desde el punto de vista físico sí hay un límite. La "teoría
especial de la relatividad" de Einstein (propuesta en 1905, diez años
antes que la teoría general, más comprehensiva que aquélla) exige suponer que
la máxima velocidad que se puede medir en relación con uno mismo es la
velocidad de la luz en el vacío, la cual equivale a 299.776 km. por segundo.
Existe una distancia determinada a la cual cualquier galaxia tiene que
alejarse de nosotros con una velocidad igual a la que acabamos de indicar;
según el punto de vista de la relatividad, esa distancia representa un límite
absoluto e insuperable. Es imposible trabajar con ningún objeto que se mueva
más deprisa que la luz en el vacío, y por consiguiente con ninguno que se
halle a una distancia superior a ese límite. Cabría aducir toda clase de
argumentos acerca de si existen o no galaxias más allá de este límite, pero
no harían al caso: es absolutamente indiferente que existan o no. Pues el
quid de la cuestión es que una vez que alcanzamos un punto del espacio tan
alejado de nosotros que una galaxia situada allí retroceda a una velocidad
igual a la de la luz en el vacío, la luz de dicha galaxia no podrá llegar
hasta nosotros. El efecto Doppler-Fizeau estira infinitamente cada una de las
longitudes de onda y reduce por tanto su energía a cero. Nada puede llegar
hasta nosotros desde una galaxia tan distante. Ni luz, ni radiación de
ninguna clase, ni neutrinos, ni influencia gravitatoria. Nada. Aun en el caso
de que fuese posible concebir algún objeto más allá de este límite de distancia,
sería algo que jamás lograríamos detectar, y no por causa de la imperfección
de nuestros instrumentos, sino debido a la naturaleza y estructura del
Universo. En consecuencia, podemos ahorrarnos el hablar de un Universo de
dimensiones infinitas. Lo que sí requiere consideración es el Universo
observable, finito tanto en diámetro como en volumen.
Sólo queda por averiguar el diámetro de ese Universo observable. Para ello,
partamos de la ecuación matemática que representa la ley de Hubble, V=kD, y
despejemos D (distancia a nosotros). La ecuación se transforma en la
siguiente:D=V/k. Lo que buscamos es la distancia correspondiente a una
velocidad de recesión igual a la velocidad de la luz. Igualamos, por tanto, V
a la velocidad de la luz y sustituimos k por 88, que es su valor. D (en
millones de años-luz) equivale entonces a 299.776 /88 = 3.400. Esto significa
que el límite del Universo observable se halla a 3.400 millones de años-luz
de nosotros en todas direcciones. Expresando lo mismo de un modo más conciso:
el Universo observable es, en apariencia, una esfera con centro en nosotros
mismos y un radio de 3.400 millones de años-luz (o un diámetro de 6.800
millones de años-luz). Así pues, de acuerdo con este análisis el límite del
Universo observable se encuentra 4.250 veces más alejado de nosotros que la
galaxia de Andrómeda. Dimensiones descomunales, no cabe duda, y que parecen
ciertamente constituir un clímax satisfactorio para esa larga búsqueda del
hombre en pos de los límites del Universo, búsqueda que se abrió con la
consideración del horizonte terrestre a pocos kilómetros de distancia. Y sin
embargo, había problemas. Algo no funcionaba en la escala del Universo tal y
como fue calculada hacia los años cuarenta basándose en la constante de
Hubble.
Revisión de la escala Cefeida
Las distancias calculadas para las galaxias muy lejanas estaban basadas en la
comparación de su brillo aparente con el de las más próximas, cuya distancia,
a su vez, había sido determinada mediante la escala Cefeida. Y de entre los valores
calculados para las más cercanas, el que parecía más cierto y fiable era el
correspondiente a la galaxia de Andrómeda. Si la distancia de Andrómeda era
errónea, entonces todas las distancias estarían equivocadas: la escala entera
del Universo sería falsa. Hacia 1950 empezó a tomar cuerpo la molesta
impresión de que el cálculo de la distancia de la galaxia de Andrómeda
escondía efectivamente un error. Si Andrómeda se hallaba a 800.000 años-luz,
como parecía indicar la escala Cefeida, entonces surgían ciertas
peculiaridades Por una parte, la galaxia de Andrómeda parecía poseer un
tamaño bastante menor que el de nuestra Galaxia: una cuarta parte del de
ésta, aproximadamente. Este hecho en sí no constituía ningún crimen, pero lo
cierto es que todas las galaxias cuyo tamaño fue posible determinar parecían
ser notablemente más pequeñas que nuestra Galaxia. Cabría replicar que alguna
galaxia tenía que ser mayor que las demás, y que da la casualidad de que
nosotros vivimos en ella. Y sin embargo, ¿qué razón había para que nuestra
Galaxia fuese mucho más grande que las demás? Sea cual fuere el proceso en
virtud del cual se formaron las galaxias, el hecho es que resultó una gama
muy amplia de tamaños. Era indiscutible que la Galaxia poseía un tamaño mucho
mayor que el de las Nubes de Magallanes, o que la galaxia de Andrómeda era
mucho más grande que sus satélites, M32 y M33. Pero cualquier porción de
dicha gama estaba representada por numerosos ejemplares; no había una sola
galaxia que fuese única en cuanto al tamaño, en ninguno de los dos extremos
de la escala... excepto la nuestra. Allí estaba nuestra Galaxia, sola, con un
tamaño mucho mayor que el resto. Además, nuestra Galaxia no poseía la forma
idónea para ser tan grande. Siempre que había ocasión de comparar entre sí
directamente varias galaxias, eran las elípticas en particular las
esferoidales clasificadas como EO-, las gigantes. ¿A qué se debía que la más
grande de todas, nuestra Galaxia, fuese una espiral? Pero había algo peor
aún, y es que aparte de que nuestra Galaxia superaba en tamaño a todas las
demás, sus elementos componentes eran también mayores y más brillantes que
los elementos semejantes de otras galaxias, como por ejemplo la de Andrómeda.
La galaxia de Andrómeda posee un halo de cúmulos globulares alrededor de su
centro, igual que nuestra Galaxia (véase pág. 88). El número de cúmulos
globulares, su aspecto y su distribución son muy similares en ambos casos.
Mas si tomamos, por ejemplo, el brillo aparente de los distintos cúmulos
globulares de Andrómeda y calculamos su luminosidad real suponiendo que se
encuentran a 800.000 años-luz, resulta que esta magnitud es, por término
medio, un cuarto de la luminosidad de nuestros cúmulos globulares, y su
diámetro aproximadamente la mitad. Incluso las estrellas como entes
individuales muestran el mismo efecto. Las novas ordinarias que han aparecido
en Andrómeda alcanzaron una luminosidad notablemente menor que las que
aparecen en nuestra Galaxia (trabajando siempre con la hipótesis de una
distancia de 800.000 años-luz). Suponer que nuestra Galaxia no sólo es una
gigante dentro de su clase, sino que está compuesta de cúmulos globulares que
son gigantes entre los de su especie y de estrellas que también son gigantes
entre las estrellas, era pedir demasiado. Parecía casi como si estuviéramos
mirando la galaxia de Andrómeda (y, por ende, todas las demás galaxias) a
través de una lente de disminución que reducía todo de tamaño. Dado que todo
cuanto estaba relacionado con la galaxia de Andrómeda había sido determinado
sobre la base de la distancia de aquélla, era inevitable preguntarse si dicha
distancia no sería errónea. Y puesto que dicha distancia, tal y como se
aceptaba en 1950, dependía a su vez de la escala Cefeida, no había más
remedio que poner también en tela de juicio dicha escala.
En los primeros años de la década de 1950-59 Baade centró su atención en este
problema, razonando que las estrellas de las Nubes de Magallanes y de los
cúmulos globulares de nuestra propia Galaxia eran estrellas de la Población II
(véase pág. 249), por lo general más pequeñas y más estables que las de la
Población I. Así pues, habían sido Cefeidas de la Población Il lo que en
origen se había utilizado para establecer la ley período-luminosidad y lo que
había servido para determinar la escala de nuestra Galaxia y la distancia de
las Nubes de Magallanes. Sin embargo, las Cefeidas que se habían utilizado
para determinar la distancia de la galaxia de Andrómeda (y, por consiguiente,
de un modo indirecto todas las galaxias lejanas) pertenecían a los brazos
espirales de Andrómeda, debido a que eran precisamente los miembros gigantes
blanco-azulados de entre las estrellas de la Población I de dichos brazos los
que, a la enorme distancia a que se halla Andrómeda, resultaban más visibles.
¿No sería que las Cefeidas de la Población I de los brazos espirales de
Andrómeda no seguían la ley período-luminosidad por la que se regían las
Cefeidas de la Población II y con la cual habían trabajado Leavitt y Shapley?
La diferencia entre ambos tipos de Cefeidas parecía ciertamente notable.
Entre las Cefeidas de la Población II figuraban muchas con períodos
especialmente breves (entre una hora y media y un día); tales períodos eran
muy raros entre las Cefeidas de la Población I, cuyos períodos solían oscilar
entre varios días y varías semanas. En segundo lugar, las Cefeidas de la
Población II eran, en términos generales, más pequeñas y tenues que las de la
Población I. Esta segunda diferencia quedaba enmascarada por el hecho de que
en nuestra Galaxia las Cefeidas de la Población I, localizadas como estaban
en medio del polvo de los brazos espirales, sufrían cierto enrojecimiento y
atenuamiento a manos del polvo interestelar, efecto que no había sido tenido
debidamente en cuenta. Las Cefeidas de la Población II poseen, en efecto, un
nombre especial debido a la notoriedad de sus propiedades en relación con las
de otras variables. Son las "estrellas RR Lyrae", nombre que
proviene de RR Lyrae, la primera (y casi la más brillante) variable de este
tipo que se estudió. Dado que las estrellas RR Lyrae se observan por lo común
en los cúmulos globulares, a veces se las denomina "variables tipo
cúmulo". Baade estudió detenidamente y por separado las Cefeidas de la
Población I y las de la Población II, y en septiembre de 1952 anunció que la
ley período-luminosidad, tal y como había sido establecida por Leavítt y
Shapley, sólo era aplicable a la variedad de la Población II. Así pues, la
distancia de las Nubes de Magallanes y las dimensiones de nuestra Galaxia
eran correctas. Las Cefeidas de la Población I, sin embargo, obedecían una
relación algo diferente, y para una periodicidad dada eran una o dos
magnitudes más brillantes de lo que cabría esperar a partir de la relación
ordinaria utilizada por Shapley. Veamos lo que esto significa. Supongamos que
se observa una lejana Cefeida con un período que corresponde a una magnitud
absoluta de -1. Esto quiere decir que si la estrella estuviera situada a 32,5
años-luz (10 parsecs) de nosotros, parecería tener una magnitud de -1. Para
que su magnitud se reduzca desde -1 hasta la magnitud real (alrededor de 20)
tendría que distar 24.000 veces más que 32,5 años-luz, es decir, 800.000
años-luz. Mas supóngase que, utilizando la nueva escala período-luminosidad
que Baade dio para las Cefeidas de la Población 1, resultara que la Cefeida
en cuestión tuviera una magnitud de -3 en vez de -1. En ese caso su brillo
sería más de seis veces superior a lo que se había pensado. Con el fin de
reducir esta estrella "seis veces más brillante" hasta una magnitud
de 20 aproximadamente, haría falta que estuviera situada, por tanto, mucho
más lejos: 58.000 veces 32,5 años-luz, es decir, casi 2.000.000 de años-luz.
Utilizando la escala Cefeida revisada y añadiendo algunos detalles
adicionales que, al parecer, es preciso introducir, se estima hoy que la
galaxia de Andrómeda se halla a unos 2.700.000 años-luz. Todas las galaxias
más allá de la de Andrómeda sufrirían además un desplazamiento
correspondiente. Esto eliminaba de golpe ese privilegio de unicidad que parecía
ostentar nuestra Galaxia. Si Andrómeda, hallándose a 2.700.000 años-luz (en
vez de 800.000), exhibe a pesar de ello el tamaño y el brillo que de hecho se
observan al telescopio, por fuerza tiene que ser mucho más grande y más
brillante de lo que se había supuesto antaño, en los días en que aún se
aceptaba esa otra distancia más corta. En la actualidad se opina que la
galaxia de Andrómeda es algo mayor que nuestra Galaxia. Andrómeda tiene un
diámetro de 200.000 años-luz y abarca hasta 300.000 millones de estrellas.
Por otra parte, hoy día se sabe que sus cúmulos globulares (más lejanos de lo
que se creía) son también mayores y más brillantes de lo que se había
supuesto; en efecto, son tan grandes y brillantes como los de nuestra
Galaxia. Las novas de Andrómeda son, asimismo, similares a las nuestras en lo
que toca a tamaño y a brillo. Finalmente se ha comprobado que todas las demás
galaxias son también más grandes y brillantes de lo que antes se creía;
muchas de las espirales rivalizan en tamaño con nuestra Galaxia e incluso
cabe que algunas de las esferoidales sean de diez a treinta veces más grandes
que ella. Nuestra Galaxia sigue siendo una galaxia gigante, pero ya no es ese
monstruo único en su especie. La galaxia de la Vía Láctea, con sus 135 mil millones
de estrellas, encaja bien en un Universo compuesto de galaxias cuyo número de
estrellas oscila entre 10 y 5.000 miles de millones. Toda vez que esta nueva
escala de distancias ha eliminado del escenario galáctico las peculiaridades
más graves, los astrónomos confían en haber hallado por fin la escala
correcta. En los años transcurridos desde la corrección de Baade nada ha
venido, ciertamente, a perturbar esta esperanza. Es más, desde su muerte en
1960, diversos astrónomos - como el ruso-americano Sergei Illarionovich
Gaposchkin (n. 1898) - han seguido analizando las fotografías de Andrómeda
tomadas con el telescopio de 200 pulgadas, confirmando plenamente su trabajo.
La nueva escala de distancias no ha afectado, naturalmente, a los cálculos de
la desviación hacia el rojo, pues son independientes de la distancia. El
cúmulo de galaxias de Virgo seguirá alejándose de nosotros a una velocidad de
1.142 kilómetros por segundo cualquiera que sea la distancia que le
asignemos. A partir del brillo de sus miembros más brillantes, y comparándolo
con el de la galaxia de Andrómeda, se comprueba que dicho cúmulo sigue
hallándose 16,5 veces más alejado que aquélla. Pero una vez que se triplica
la distancia de Andrómeda, también es preciso triplicar la distancia del cúmulo
de Virgo. Por tanto, debemos situarlo a unos 2.300.000 X 16,5 = 38.000.000 de
años-luz, en vez de sólo 13.000.000. Para determinar la constante de Hubble
lo que hicimos fue dividir la velocidad de recesión de una galaxia o cúmulo
de galaxias por el número de millones de años-luz que distaba de nosotros. En
vez de dividir 1.142 por 13 debemos dividirlo ahora por 38, de suerte que la
constante de Hubble equivale a 30, en lugar de a 88. Si esta cifra peca de
algo, probablemente será por defecto. Establezcamos, pues, el valor de la
constante de Hubble en 24. Con el fin de determinar la distancia a la cual
tiene que hallarse una galaxia para alejarse a la velocidad de la luz,
recurramos de nuevo a la ecuación D=V/k, igualando V a 299.776, y k ahora a
24. El resultado es que D vale 12.500, con lo cual podemos decir que una
galaxia situada a una distancia de 12.500 millones de años-luz no puede ser
ya detectada. Este es el límite del Universo observable, o "radio de
Hubble". Expresando lo mismo con otras palabras, podemos decir que el
diámetro de la esfera del Universo observable (con nosotros mismos en el
centro) es de 25.000 millones de años-luz: un diámetro casi cuatro veces
superior al que se admitía como correcto todavía en 1950.
Cap. 15. El origen del Universo
El "Big Bang"
El cambio sufrido por la escala de distancias del Universo no se limitó a
subsanar ese anómalo supergigantismo de nuestra Galaxia, sino que vino a
mitigar notablemente una discrepancia mucho más seria. En el segundo cuarto
del siglo XX los astrofísicos y los geólogos volvieron a discrepar acerca de
la edad de la Tierra, como ya lo hicieran casi un siglo antes en los días de
Helmholtz (véase pág. 148). La discrepancia surgió una vez más en torno a un
fenómeno que no parecía plantear ningún problema en el presente ni en el
futuro, pero que suscitaba graves dificultades cuando era extrapolado hacia
el pasado. En tiempos de Helmholtz se había tratado de la supuesta
contracción del Sol; en los días de Hubble era la expansión del Universo. Si
intentamos mirar hacia adelante en el tiempo y aceptamos el hecho de que las
galaxias continuarán alejándose indefinidamente unas de otras tal y como lo
hacen en la actualidad, no tropezamos con ninguna dificultad insuperable.
Todas y cada una de las galaxias fuera de nuestro Grupo Local seguirán
retrocediendo a una velocidad que aumenta regularmente a tenor del
crecimiento regular de la distancia. Las galaxias se harán cada vez más
tenues, debido tanto al aumento de distancias como al desvío hacia el rojo -
cada vez más pronunciado - y a la consiguiente disminución de la energía de
la luz. De este modo, llegará un momento en que todas ellas se aproximarán al
límite del Universo observable, perdiéndose para nosotros. El universo
observable consistirá entonces únicamente en nuestro Grupo Local. Esto quizá
parezca un futuro muy solitario, pero la cierto es que sólo perderemos
objetos que no son visibles a simple vista, objetos de cuya existencia y
verdadera naturaleza no hemos llegado a percatamos sino en los últimos
cincuenta años. Quiere decirse que la pérdida no será demasiado grande para
los no-astrónomos. Además este fenómeno está previsto para dentro de mucho
tiempo - cien evos o más -, y para entonces habrán sobrevenido
acontecimientos de consecuencias más directas para nosotros. El Sol se habrá
convertido en una enana blanca y nuestro sistema planetario será un lugar
inhóspito, suponiendo, claro está, que haya logrado sobrevivir a la etapa de
gigante roja del Sol. Todas las estrellas que sean más grandes y más
brillantes que las enanas rojas se habrán convertido en enanas blancas, y
todas las galaxias se hallarán en una edad extremadamente avanzada. Es
posible que para entonces se hubieran formado nuevas estrellas, pero lo
cierto es que dentro de cien evos la reserva de polvo y gas habrá disminuido
hasta valores mínimos, con lo cual el número de estrellas nuevas será escaso.
Por lo demás, estas nuevas estrellas se habrán formado a partir de un gas tan
sobrecargado de átomos complejos (dispersados por el espacio como
consecuencia de los cientos de millones de supernovas que habrán explotado en
el ínterin) que su provisión de hidrógeno será sobremanera exigua, lo cual
determina una vida muy efímera para tales estrellas.
Por muy sórdida que parezca esta imagen del futuro, no contradice ninguna de
las ideas científicas aceptadas ni plantea ningún dilema grave a los
astrónomos. No puede esperarse que el Universo respete las emociones humanas.
Envejecerá y morirá sin consideración alguna para con los lamentos del
hombre, y sus componentes seguirán alejándose unos de otros en un proceso de
eterna expansión incluso después de que las galaxias se hayan consumido hasta
convertirse en cenizas de enanas blancas. Pero supongamos ahora que miramos
hacia atrás en el tiempo, que invertimos la dirección de marcha de la
expansión del Universo como si se tratara de una película de cine. En ese
caso debemos imaginarnos las galaxias aproximándose unas a otras con
velocidades conocidas, sólo que ahora el proceso no puede continuar
eternamente. Tiene que llegar un momento en que las galaxias se encuentren.
Si la ley de Hubble sigue siendo válida para este caso, de modo que cada una
de las galaxias se movería hacia adentro con una velocidad proporcional a su
distancia a partir de una concreta (tal como la nuestra) tomada como patrón,
entonces hay que mirar el Universo en general como sometido a un proceso de
contracción, en virtud del cual todas las galaxias llegarían a reunirse
simultáneamente en un punto. Dicho con otras palabras: tuvo que existir un
momento en el pasado en el que toda la materia y energía del Universo se
hallasen concentradas en un gran bloque. En ese momento del pasado
("tiempo cero") el Universo no podía, en modo alguno, tener el
aspecto que presenta hoy día; el "Universo que conocemos" no pudo
existir sino a partir de este tiempo cero, y este tiempo cero cabe
considerarlo como el origen del Universo. El tiempo cero del Universo se
puede calcular a partir de las distancias que separan hoy día a las galaxias
y de la velocidad con que se expande en la actualidad el Universo. De acuerdo
con la escala de distancias que rigió entre 1925 y 1952, el tiempo cero tuvo
que ocurrir hace, aproximadamente, 2.000.000.000 de años. Dos evos es una
longitud de tiempo respetable; ciertamente mucho mayor que los veinte
millones de años que Helmholtz asignó a la Tierra. Sin embargo, dos evos no
son todavía una cifra suficiente para los geólogos, quienes acogieron este
valor con gran desilusión. ¿Qué significado tenía decir que el Universo
existía hace dos evos en forma de un simple globo de materia y que a partir
de ahí se habían formado todas las galaxias, cuando, sobre la base de los
cálculos del uranio-plomo, se había comprobado que la Tierra tenía una edad
de más del doble que aquélla? La Tierra no podía ser dos veces más vieja que
el Universo. Algún error grave tenía que haber, o en las velocidades de
desintegración del uranio, o en la constante de Hubble.
La situación permaneció estática hasta que los trabajos de Baade demostraron
que el error residía en la escala de distancias del Universo y que dicho
error había resultado en un valor excesivo para la constante de Hubble. Una
vez más los geólogos tenían razón, mientras los astrónomos se habían
equivocado. La nueva escala de distancias del Universo parecía indicar que el
tiempo cero había ocurrido hace 13 evos. Si esta cifra peca de algo no cabe
duda de que es por defecto, pues al medir la edad de los cúmulos estelares
los astrónomos obtienen a veces cifras del orden de 10 a 25 evos. Sin
embargo, nadie pretende que la determinación de la constante de Hubble se
halle a salvo de ulteriores correcciones, ni que los métodos utilizados para
calcular la edad de los cúmulos estelares sean algo más que meras
aproximaciones. Así pues, cualquier polémica acerca de la posición exacta del
tiempo cero sería más bien prematura; por el momento baste con decir que el
tiempo cero, si de verdad existe, tuvo que ocurrir como mínimo hace 15 evos,
y que desde entonces ha habido tiempo suficiente a lo largo de la vida del
Universo para que se formara el sistema solar. Mas ¿qué es lo que ocurrió en
el tiempo cero? El primero en considerar seriamente este punto fue el
astrónomo belga Georges Edward Lemaître (1894-1966). En 1927 sugirió que en
el tiempo cero toda la materia y energía del Universo se hallaban efectiva y
literalmente comprimidas en una gigantesca masa de diámetro quizá no superior
a unos cuantos años-luz. Lemaître llamó a esta masa el "huevo
cósmico", pues a partir de él se formó el "cosmos" (sinónimo
de Universo). El huevo cósmico era inestable y estalló en lo que cabe
imaginar como la más fantástica y catastrófica explosión de todos los
tiempos, pues los fragmentos de dicha explosión resultaron ser luego las
galaxias, que fueron despedidas violentamente en todas direcciones. Los
efectos de la explosión los tenemos todavía bien visibles en el alejamiento
mutuo de las galaxias y cúmulos de galaxias. Si los diferentes fragmentos del
huevo cósmico salieron despedidos hacía afuera con distintas velocidades
(según el lugar que ocupara originalmente el fragmento dentro del huevo y
según la medida en que se viese frenado por las colisiones con otros
fragmentos), aquellos que terminaron con una velocidad alta irían adquiriendo
una ventaja cada vez mayor sobre los de velocidad baja, Lemaître sostenía que
este efecto daría lugar a la situación que conocemos hoy día: las galaxias se
alejan unas de otras con velocidades de recesión proporcionales a la
distancia. (También es posible que aunque el huevo cósmico no tuviese momento
angular alguno, parte de los fragmentos adquirieran cierto momento angular en
el sentido de las manillas del reloj como consecuencia de la explosión,
mientras que otros adquirieron un momento angular de sentido contrario, de
suerte que la suma total fuese nula.)
El modelo del Universo propuesto por Lemaître es el análogo físico del modelo
teórico de de Sitter. El Universo de de Sitter se expandía simplemente porque
de este modo cuadraba bien con una serie de ecuaciones planteadas por Einstein.
La expansión del modelo de Lemaître se debía, por el contrario, a un suceso
físico: una explosión que difería en proporciones, pero no en naturaleza, de
la de un cohete de feria. La idea del modelo de Lemaitre se capta muy
fácilmente; es concreto, espectacular y parece exotérico. Eddington lo adoptó
y divulgo, y desde entonces el astrofísico ruso-americano George Gamow
(1904-1968) lo ha defendido de un modo entusiástico. Haciendo referencia a
esa inmensa explosión inicial del huevo cósmico, Gamow bautizó el modelo del
Universo de Lemaître con el nombre de "teoría del big bang", aunque
cabría llamarlo, de una forma menos espectacular, "teoría del Universo
en explosión". Naturalmente, uno siente enseguida curiosidad por saber
cuál era la naturaleza del huevo cósmico. ¿De qué estaba compuesto? ¿Cuáles
eran sus propiedades? Quizá podamos hacernos una idea al respecto si
observamos (mentalmente) el Universo corriendo hacia atrás y hacia adelante
en el tiempo. En la actualidad el Universo parece componerse aproximadamente
de un 90% de hidrógeno, un 9 % de helio y 1 % de átomos más complejos. A
medida que el Universo progresa hacia adelante en el tiempo, el hidrógeno se
va fusionando continuamente en helio, y éste, a su vez, en átomos más
complejos dentro del núcleo central de las estrellas. Si dejamos que el
Universo marche hacia atrás, la cantidad de helio y átomos más complejos
decrece y la cantidad de hidrógeno aumenta. Así pues, conforme nos acercamos
al tiempo cero, cabría esperar que el Universo consistiera por entero, o casi
por entero, en hidrógeno. Ahora bien, a medida que presenciamos la película
del Universo marcha atrás, la materia y la energía se van haciendo más
compactas. En el tiempo cero, el hidrógeno que exista tiene que hallarse
comprimido hasta el límite; todas las partículas que lo componen se aprietan
unas contra otras hasta más no poder.
El átomo de hidrógeno consta sólo de dos partículas: un protón central que
porta una carga eléctrica positiva y un electrón exterior con una carga
eléctrica negativa. Mientras estos dos componentes mantienen una existencia
propia, la presión a que se puede someter una masa de hidrógeno tiene un
límite. Pero si sobrepasamos cierta presión crítica, todo ocurre como si los
electrones y protones se aplastaran unos contra otros para formar una masa de
partículas sin carga eléctrica llamadas neutrones. Una masa tal de neutrones
comprimidos hasta el límite se denomina a veces "neutronio" (aunque
Gamow utiliza el término "ylem", palabra latina que significa la
sustancia a partir de la cual se formó toda la materia). El neutronio tendría
una densidad de unos 1.000 billones de gramos por centímetro cúbico y sería
mucho más denso que la enana blanca más densa que se conoce.
La formación de los elementos
Sin comprometerse en cuanto a la naturaleza del huevo cósmico, Lemaître lo
había concebido como una especie de superátomo radiactivo que se desintegraba
como los átomos radiactivos normales, sólo que a una escala increíblemente
mayor. A partir de las diversas porciones del huevo cósmico se formaron las
galaxias actuales, pero, a una escala mucho más íntima, el huevo cósmico
también se desintegró para constituir los átomos que conocernos hoy día.
Ahora bien, desde el punto de vista de Lemaître estos átomos se formaron de
arriba abajo, por así decirlo, de suerte que primero se formarían átomos muy
masivos que se desintegrarían en otros menos masivos, y así sucesivamente
hasta llegar a átomos perfectamente estables. Este proceso implicaría la
existencia de un Universo compuesto principalmente de átomos tales como los
de plomo y bismuto, que de entre los estables son los de mayor masa que se
conoce, pero no explicaría la preponderancia del hidrógeno en el Universo.
Una concepción alternativa en cuanto a la formación de los elementos fue la
que ofreció Gamow en 1948, y en la cual colaboraron también Bethe y el físico
americano Ralph Asher Alpher (n. 1921). De acuerdo con la concepción de
Gamow, en el momento del "big bang" el huevo cósmico, compuesto de
neutronio, se desintegró con feroz violencia en neutrones individuales, que
rápidamente se descompusieron en protones y electrones. (Este proceso de
desintegración del neutrón se sigue verificando hoy día, siendo la vida media
de unos trece minutos.) Los protones así formados cabe considerarlos como
núcleos de átomos de hidrógeno. A medida que se fuesen formando los protones,
éstos chocarían de vez en cuando con los neutrones que aún quedaran e irían
constituyendo gradualmente núcleos atómicos estables de mayor complejidad. La
ventaja de esta teoría es que hace uso del fenómeno de adición de neutrones,
proceso hacia el cual los átomos se muestran muy proclives y que se puede
observar en el laboratorio.
Si un protón se combina, por ejemplo, con un neutrón, se formaría un núcleo
de hidrógeno 2, o deuterio (un protón / un neutrón). El hidrógeno 2,
combinado con otro neutrón, daría lugar al hidrógeno 3 o "tritio"
(un protón / dos neutrones). Sin embargo, el tritio es inestable. Uno de los
neutrones de su núcleo emite un electrón y se convierte en un protón, de modo
que el núcleo se transforma en helio-3 (dos protones / un neutrón). El núcleo
de helio-3 se anexiona un neutrón, convirtiéndose en helio-4 (dos protones /
dos neutrones). El proceso continúa, y paso a paso, neutrón tras neutrón, se
va formando la lista completa de los elementos. Dadas las temperaturas
increíblemente altas que seguirían a la explosión del huevo cósmico, Gamow
opina que las reacciones nucleares pertinentes se desarrollaron de un modo
muy rápido, quizá incluso dentro de la primera media hora. A partir de ese
momento, y conforme fuese disminuyendo la temperatura, los diversos núcleos
irían atrayendo hacia sí gradualmente electrones y formando átomos; los
átomos se aglomerarían en volúmenes ingentes de gas, los cuales se alejarían
a gran velocidad del lugar donde explotó el huevo cósmico, condensándose poco
a poco, a lo largo de esta huida, en galaxias y estrellas. Ni que decir tiene
que de los núcleos de hidrógenos formados en origen sólo una pequeña porción
colisionaría con neutrones para formar hidrógeno-2; que de estos núcleos de
hidrógeno-2 sólo una parte exigua chocaría contra algún neutrón para dar
lugar a helio-3, etc. A medida que ascendiéramos en la escala de complejidad,
cada átomo sería menos común que el anterior; esto vendría a explicar el
hecho de que hoy día en el Universo la abundancia de los átomos decrece de
una forma más o menos constante a medida que aumenta su complejidad. Este
decrecimiento no es, sin embargo, absolutamente uniforme. El helio-4 es mucho
más común que el hidrógeno-2 o que el helio-3, y el hierro-56 es mucho más
abundante que la mayor parte de los átomos menos complejos que él. Por otro
lado, átomos simples como los del litio-6 litio-7, berilio-9, boro-10 y
boro-11 son menos comunes, a escala cósmica, de lo que debieran ser habida
cuenta de su simplicidad. La teoría de Gamow puede ofrecer una explicación
tentativa de esta anomalía. El helio-4 y el híerro-56, por ejemplo, son dos
núcleos especialmente estables que difícilmente reaccionarían para formar
átomos más complejos, por lo cual se irían acumulando. Los átomos de litio,
berilio, y boro, por el contrario, reaccionan con extrema facilidad, por lo
cual se "quemarían" rápidamente. La teoría de Gamow está en
condiciones de explicar la abundancia relativa de los diversos átomos en la
materia interestelar. Una vez que se forman las estrellas, son otros los
cambios que se operan en su interior.
Sin embargo, dicha teoría presenta un grave inconveniente que hasta la fecha
nadie ha sabido subsanar. Se trata de lo siguiente: los átomos se tienen que
formar mediante la adición de neutrones, pero de uno en uno; cuando se llega
al núcleo del helio-4, se produce una zanja que no podemos saltarnos a la
torera. El núcleo de helio-4 es tan estable que su tendencia a aceptar un
neutrón o un protón es prácticamente nula. Y en el caso de que un neutrón
consiga anexionarse a un núcleo de belio4, el núcleo de helio-5 formado (dos
protones / tres neutrones) se desintegra en 10-21 segundos aproximadamente
(una milésima de tríllonésima de segundo) para constituir de nuevo un núcleo
de helio-4 y un neutrón. Por otra parte, si un protón consigue anexionarse al
helio-4, el litio-5 (tres protones / dos neutrones) formado se desintegra de
nuevo en helio-4 a una velocidad mayor aún que la anterior. Supongamos, por
otro lado, que un núcleo de helio-4 choca con un segundo núcleo de helio-4 y
que ambos se fusionan. Este suceso es mucho menos probable que la fusión del
helio-4 con una de esas partículas tan abundantes que son los protones y
neutrones, pero aun así tampoco constituye una solución. El elemento formado
es el berilio-8, que se desintegra en dos partículas alfa con una celeridad
también extrema. En otras palabras, una vez constituido el helio-4 mediante la
adición de neutrones, el proceso se atasca. En el 5 y en el 8 hay dos zanjas
que, al parecer, son infranqueables. Cabe, desde luego, que dos partículas se
estrellen simultáneamente contra el núcleo de helio-4. Si las partículas que
chocan y se anexionan son un protón y un neutrón, entonces se forma litio-6
(tres protones/tres neutrones). Este elemento es estable y el proceso podría
proseguir. Por desgracia, en las condiciones postuladas por Gamow para esa
primera media hora después del "big bang", los núcleos se
encuentran tan espaciados que la probabilidad de que dos partículas choquen
al mismo tiempo contra una partícula alfa es virtualmente nula. Así, pues, la
teoría de Gamow parece explicar la formación de átomos de hidrógeno y helio,
pero nada más.
En contraposición a esta teoría de la formación de los elementos existe otra
que hemos aceptado implícitamente en este libro y utilizado en la discusión
acerca de las estrellas de la segunda generación. Esta teoría ha sido
sugerida por Fred Hoyle, quien considera que el material originario estaba
constituido sólo de hidrógeno-1 y que los demás elementos se formaron en el
interior de las estrellas, pasando a la materia interestelar por vía de las
supernovas. Hoyle recurre a los mismos mecanismos propuestos por Gamow, pero
con una diferencia. En el núcleo centro, de las estrellas la densidad de
materia es mucho más alta que en el espacio abierto, lo cual significa que la
probabilidad de que dos partículas colisionen de un modo más o menos
simultáneo con un núcleo de helio-4 es notablemente mayor que en la teoría de
Gamow. Es más, toda vez que la zona central de las estrellas es más rica en
helio-4 que en cualquier otro elemento, existe una probabilidad relativamente
alta de que dos núcleos de helio-4 choquen contra un tercero en un lapso de
tiempo suficientemente breve para formar un núcleo de carbono-12. Esto
salvaría la zanja que representan los átomos estables comprendidos entre el
helio-4 y el carbono-12: los átomos de litio, berilio, y boro que ya
mencionamos antes. Estos átomos ligeros sólo se formarían a través de
procesos secundarios menos comunes, lo cual explicaría su relativa rareza en
el Universo actual. La idea de la formación de los elementos en el corazón de
las estrellas no sólo fue concebida para evitar la zanja de los niveles de 5
y 8 partículas, sino que viene también avalada por una prueba empírica
interesante. El espectro de ciertas estrellas (poco comunes) de la clase
espectral S delata la presencia de un elemento llamado "tecnecio".
El tecnecio es un elemento radiactivo que no posee ninguna variedad atómica
estable. La variedad que más se aproxima a la estabilidad es el tecnecio-99,
que tiene una vida media de unos 220.000 años. Tiempo muy largo sí lo medimos
a escala humana, pero lo cierto es que al cabo de cinco millones de años
(lapso insignificante en la vida de una estrella ordinaria) sólo quedaría una
milmillonésima parte de la cantidad inicial de tecnecio-99. De aquí se sigue
que si hoy día se puede detectar el tecnecio (por medios espectroscópicos,
como hemos dicho), este elemento no pudo existir en el momento en que se
formó la estrella, sino que tuvo que constituirse en el interior de ésta.
Así pues, en términos generales se puede decir que el peso de la
plausibilidad y de las pruebas empíricas de que disponemos parece favorecer,
hoy por hoy, al modelo de Hoyle de la formación de los elementos frente al de
Gamow.
Antes del "Big bang"
Si postulamos la existencia de un huevo cósmico como la forma original del
Universo e igualamos el momento de su explosión al tiempo cero, nos vemos
obligados a preguntar: ¿Pero de dónde vino el huevo cósmico? Podríamos
zafarnos de esta pregunta refugiándonos simplemente en la eternidad. La ley
de la conservación de la energía implica que la sustancia del Universo es, en
esencia, eterna, por lo cual podemos decir que la materia de que se componía
el huevo cósmico estuvo allí desde siempre. Ahora bien, aun concediendo que
la materia del huevo cósmico estuviera allí desde siempre, ¿lo estuvo en
forma de huevo cósmico? Si el huevo cósmico, como tal, existió desde siempre,
tenía que ser estable. Y si era estable, ¿por qué dejó entonces de serlo
repentinamente y explotó en el momento que hemos dado en llamar tiempo cero,
tras incontables evos durante los cuales, lejos de estallar, se había
limitado simplemente a existir? El problema con que nos enfrentaríamos sería
el mismo - sólo que a escala estelar - si nos preguntáramos por qué una
estrella experimenta una explosión tipo supernova después de haber existido
durante evos en condiciones de relativa estabilidad. En el caso de las
estrellas, sin embargo, sabemos hoy día lo suficiente como para poder
explicar este fenómeno en función de las reacciones nucleares progresivas que
se desarrollan en el interior estelar. Por desgracia, es imposible estudiar
las propiedades de un huevo cósmico: no sabemos nada acerca de lo que ocurre
en su interior, ni conocemos las fuerzas que serían capaces de mantenerlo
estable o de provocar cambios progresivos que, en un momento dado y de
súbito, lo convirtieran en inestable. Ahora bien, si en vez de devanarnos los
sesos tratando de imaginar una explicación para dicha estabilidad, nos
preguntáramos en qué forma podría existir la sustancia del Universo para
permanecer estable a lo largo de innumerables evos, veríamos que lo más fácil
es concebir el cosmos como un gas extremadamente disperso. El Universo sería
entonces esa especie de "espacio vacío" que existe hoy entre las
galaxias y que sin duda alguna es estable. Un gas de este tipo, en extremo
rarificado, seguiría estando sometido, no obstante, a su propio campo
gravitatorio, sobremanera difuso. A lo largo de los evos el gas se iría
apelotonando lentamente y el Universo iría contrayéndose. A medida que la
sustancia del Universo se hace más compacta, el campo gravitatorio se va
intensificando; al cabo de muchos evos, el Universo se halla sometido a un
proceso muy rápido de contracción. Tal contracción, empero, por fuerza tiene
que provocar un calentamiento en el Universo - un calentamiento "a la
Helmholtz" - y originar temperaturas cada vez más altas en esa materia
que se comprime en un volumen cada vez más reducido. El aumento de
temperatura contrarresta de modo creciente la contracción gravitatoria y
acaba por frenarla.
Sin embargo, a causa de la inercia de la materia, ésta sigue contrayéndose
por encima del punto donde el efecto térmico equilibraría exactamente a la
fuerza de la gravedad, de suerte que en último término el Universo se contrae
hasta un volumen mínimo, que representa el huevo cósmico o algo muy similar a
él. En una fase posterior la temperatura y la radiación comienzan a empujar
hacia afuera, y la sustancia del Universo se ve lanzada hacia el exterior,
cada vez más de prisa, en un proceso que rápidamente desemboca en el "big
bang". Según esta concepción, el Universo parte de un estado
caracterizado por un vacío virtual, pasa por una fase de contracción hasta
alcanzar una densidad máxima y después por una tercera etapa de expansión que
conduce de nuevo al vacío. No es preciso, pues, que nos rompamos la cabeza
especulando acerca de un huevo cósmico que existía "desde siempre"
y que luego, tras un período indefinido de estabilidad, explotó de pronto:
basta para ello concebir el huevo cósmico como un objeto momentáneo situado a
medio camino en la eternidad. Este modelo se denomina "Universo
hiperbólico", y admite una representación gráfica sin más que considerar
su "radio de curvatura". Un rayo de luz que viajara indefinidamente
a través del tipo de Universo al que Einstein asignó una geometría
riemanniana (véase pág. 263) describiría una inmensa trayectoria circular
cuyo radio sería el radio de curvatura del Universo. En un Universo en
contracción, este radio sería decreciente; en un Universo en expansión,
creciente. En un Universo hiperbólico, el radio decrecería primero hasta un
mínimo y luego aumentaría. El Universo hiperbólico perdura a través de la
eternidad, mas no es auténticamente eterno en el sentido de que persista
siempre en unas condiciones esencialmente invariables o en un estado que
oscile alrededor de un promedio inmutable, sino que experimenta un cambio
permanente e irreversible: comienza en la forma de un Universo vacío, lleno
de un gas muy disperso (presumiblemente hidrógeno) y termina en forma de un
universo también vacío, pero colmado de innumerables enanas blancas. Existen
un comienzo y un fin bien definidos, y nosotros habitamos el breve intervalo
de tiempo durante el cual el Universo se desvía pasajeramente de su eterno
vacío.
Sin embargo, el Universo hiperbólico no es el único modelo que se puede
deducir a partir de una consideración teórica del huevo cósmico. Aunque
concibamos el Universo como desintegrado en trozos que salen despedidos hacia
afuera como consecuencia de la fuerza de una explosión gigantesca, siempre
queda la fuerza de la gravitación universal que tenderá a reunir de nuevo los
fragmentos y que, quizá, lo podría lograr. Para entender lo que esto
significa, consideremos una situación análoga en nuestro planeta. Una
explosión normal proyecta al aire violentamente los distintos fragmentos,
pero la velocidad con que éstos se alejan de la Tierra disminuirá
constantemente debido a la atracción de la gravedad. Al cabo de cierto tiempo
los fragmentos se tienen durante un instante en su fuga y comienzan a caer de
nuevo hacia la Tierra. Cuanto más violenta sea la proyección inicial del
fragmento hacía arriba, tanto mayor será la altura que alcanzará éste antes
de pararse e iniciar su regreso. Ahora bien, el campo gravitatorio terrestre
disminuye con la distancia, y si el objeto se lanza hacia arriba con un
impulso suficiente llegará a regiones en las cuales el campo gravitatorio de
la Tierra, cada vez más débil, no bastará para anular por completo la
velocidad (cada vez menor) del objeto. En este caso se dice que el objeto ha
sido lanzado hacia arriba con una velocidad mayor que la "velocidad de
escape" que para la superficie terrestre es aproximadamente de once
kilómetros por segundo.
Sin conocer el tamaño real del huevo cósmico, ni su masa, ni la fuerza de la
explosión que lo desintegró, resulta difícil averiguar si los fragmentos que
salieron despedidos hacia el exterior lograron alcanzar o no la velocidad de
escape. ¿Seguirán alejándose las galaxias unas de otras para siempre, o irá
disminuyendo lentamente su velocidad de recesión hasta anularse durante un
instante, aproximándose luego unas a otras, despacio al principio, luego cada
vez más rápidamente? Supongamos que llegue un día en que las galaxias
comiencen efectivamente a juntarse de nuevo. En este Universo en contracción
la radiación emitida por las galaxias experimenta un desvío hacia el violeta,
cuya intensidad aumenta a medida que la velocidad de aproximación crece como
consecuencia de la aceleración de la contracción. La energía que se vierte
así en el centro del Universo se comprime, por así decirlo, a la par que
aumenta. Bajo el azote de esta invasión de energía, las reacciones nucleares
que se desarrollan en un Universo en expansión experimentan una inversión
total. Mientras que en un Universo en expansión (cuya radiación disminuye
constantemente) la fusión de hidrógeno en hierro suministraría energía, en un
Universo en contracción (de radiación cada vez mayor) la desintegración del
hierro en hidrógeno absorbería energía.
En resumen, cuando el Universo se hubiera condensado hasta un límite próximo
al del huevo cósmico, aquél estaría compuesto otra vez de hidrógeno en su
totalidad. La formación del huevo cósmico se vería seguida de un nuevo
"big bang", y el proceso completo volvería a comenzar. El resultado
sería un "Universo pulsante" o "Universo oscilante". El
Universo pulsante cabría concebirlo como una variable Cefeida ingente. Tal
Universo sería eterno en el sentido estricto de la palabra, pues aunque se
producen cambios catastróficos, éstos son periódicos. No existe un origen ni
un fin bien definidos, como tampoco existen cambios constantes e
irreversibles que transformen una estructura universal dada en otra
completamente distinta. Después de contraerse y explotar de nuevo, el
Universo recuperará dentro de un número indefinido de evos su forma actual,
forma que ya tuvo cierto número de evos antes de su último colapso y
explosión.
Creación continua
Y sin embargo, al menos antes de 1952, la teoría del "big bang"
parecía llevar inherente a ella un elemento de imposibilidad, pues situaba el
tiempo cero 2 evos atrás, cuando la propia Tierra tenía una edad de casi 5
evos. El "big bang" debía ser, por fuerza, una ilusión. Era preciso
construir un modelo del Universo que no utilizase para nada el huevo cósmico.
El nuevo modelo nació de la idea intuitiva siguiente: el aspecto general del
Universo debe ser el mismo cualquiera que sea el punto de observación
elegido. Desde cualquier punto del Universo, desde cualquier galaxia en que
se sitúe el observador, éste hallaría que las galaxias se distribuyen
simétricamente en torno a él en todas direcciones, que la densidad general de
la materia es idéntica, que todas las demás galaxias se alejan con una
velocidad proporcional a su distancia; en pocas palabras, se hallaría a sí
mismo en el centro del Universo observable.
La noción de un Universo generalmente uniforme a través de todo el espacio
fue concebida por el cosmólogo inglés Edward Arthur Milne (1896-1950), quien
la denominó el "principio cosmológico". El principio cosmológico no
pasa de ser una hipótesis, pero una hipótesis que, a falta de pruebas
concluyentes que demuestren su falsedad, ejerce un gran poder de atracción
sobre los astrónomos, toda vez que haciendo uso de ella el Universo se reduce
a un nivel de simplicidad suficiente para quedar reflejado en la clase de
modelos que los astrónomos pueden construir. Einstein, por ejemplo, aceptó el
principio cosmológico al trabajar con un Universo cuya materia se encontraba
diseminada de modo uniforme, pues no cabe duda de que en ese caso el aspecto
del cosmos sería idéntico cualquiera que fuese la posición del observador. El
principio cosmológico parece pedir un Universo infinito, pues de otro modo
cabría pensar que si el observador se traslada hasta el mismo borde, vería
todas las galaxias a un lado y nada al otro. Ahora bien, ¿cómo era posible
conciliar esta idea con el Universo riemanniano supuesto por Einstein, un
Universo de volumen finito? En realidad, sí es posible que un Universo de
volumen finito contenga un número infinito de galaxias.
Según la teoría de la relatividad de Einstein, es necesario suponer que un
objeto que se mueve con respecto a un observador resultará - a través de
cualquier medida que éste haga - más corto en la dirección del movimiento que
lo que sería si se encontrara en reposo con respecto a dicho observador. Y a
mayor velocidad, más pronunciado será este "acortamiento". Si el
objeto se mueve a la velocidad de la luz, su longitud en la dirección del
movimiento se reducirá a cero. Las lejanas galaxias, en su movimiento de
recesión, tienen que aparecer más cortas para cualquier observador terrestre;
y cuanto más lejanas, tanto más acortadas, toda vez que la velocidad de
recesión aumenta con la distancia. Cerca del borde del Universo observable
las galaxias adquieren un espesor igual o inferior al de una hoja de papel,
con lo cual en este límite se pueden apelotonar un número infinito de
galaxias. De este modo tenemos un Universo infinito empaquetado en un volumen
finito. (Debido al desvío hacia el rojo, esta infinidad de galaxias en el
borde del Universo no liberarían más que una cantidad finita de radiación, de
partículas o de fuerza gravitatoria hacia el interior). Naturalmente, un
observador situado en una de las galaxias del borde no se vería a sí mismo y
a su galaxia del espesor de una hoja de papel. Su galaxia, igual que las de
su inmediata vecindad, se le antojarían normales. Pero a una distancia
suficientemente grande este observador también vería un borde con una
aglomeración infinita; y nuestra Galaxia, caso de que pudiera observarla, le
parecería tan delgada como una hoja de papel. (Es cuestión simplemente de
punto de vista, igual que los australianos nos parecerían andar de cabeza, y
viceversa, si la Tierra fuese transparente y pudiéramos mirar a través de
ella.) Un Universo infinito de estas características no concuerda bien con la
noción del huevo cósmico, pues no cabe duda de que resulta mucho más fácil
pensar que el huevo cósmico posee un tamaño finito, y no infinito, y que al
explotar dio lugar a un número finito de galaxias. Gamow, sin embargo, está
dispuesto a considerar un huevos cósmico de tamaño infinito, y en ese caso el
principio cosmológico no sería incompatible ni con el Universo hiperbólico,
ni con el pulsante.
Para tres astrónomos que trabajan en Inglaterra - el austríaco de nacimiento
Hermann Bondi (n. 1919), Thomas Gold (n. 1920) y Fred Hoyle - el principio
cosmológico estaba, de algún modo, incompleto. Cierto que dejaba inalterado
el Universo al variar la posición del observador en el espacio, pero ¿y
acerca de su posición en el tiempo? Si el Universo experimenta cambios que
son irreversibles, como en el caso del Universo hiperbólico, o reversibles al
cabo de muchos evos, como en el caso del Universo pulsante, un observador
vería que la naturaleza del Universo variaba radicalmente con el tiempo. Hace
10 evos, por ejemplo, el observador vería un Universo de pequeñas
dimensiones, colmado de galaxias jóvenes muy juntas y constituidas casi por
entero de estrellas jóvenes compuestas de hidrógeno y de muy pocos elementos
más. Dentro de 50 evos, a partir de ahora, el observador quizá vería un vasto
Universo vacío, con galaxias separadas por enormes distancias y compuestas en
su mayor parte de enanas blancas. Y dentro de 100 evos el observador acaso se
hallaría ante un Universo en contracción. Bondi, Gold y Hoyle opinaban que no
era lógico suponer que las cosas sucedan así. El Universo debía ser
fundamentalmente idéntico cualquiera que fuese el momento y el lugar de observación,
idea que bautizaron con el nombre de "principio cosmológico
perfecto". No obstante, el Universo cambiaba de dos modos importantes:
dos modos que se aceptaban sobre la base de pruebas empíricas muy fuertes y
que no admitían ninguna clase de discusión. En primer lugar, la distancia
intergaláctica aumenta constantemente, y, en segundo lugar, el hidrógeno no
cesa de fusionarse en helio y en otros átomos más complicados. Si el
principio cosmológico perfecto pretende ser válido, entonces tienen que existir
procesos que neutralicen tales cambios. La solución que sugirieron los tres
astrónomos en 1948 consistía en suponer que el hidrógeno se creaba
continuamente de la nada; esta idea se conoce con el nombre de "teoría
de la creación continua" o "teoría del estado estacionario".
Naturalmente, la primera reacción ante tal sugerencia es objetar que viola la
ley de la conservación de la energía. Pero esta ley es una simple hipótesis
basada en el hecho de que la humanidad nunca ha observado que la energía se
cree de la nada. Por otra parte, lo que exige la teoría de la creación
continua es bien poco; bastaría con que la materia se creara a un ritmo de un
átomo de hidrógeno por año en un espacio de mil millones de litros y tal
ritmo de creación sería demasiado pequeño para poder detectarlo con los
instrumentos que conocemos hoy día. La creación continua no violaría en
realidad la ley de la conservación de la energía, pues ésta no dice que
"la energía no se puede crear de la nada", sino simplemente que "nunca
se ha observado que la energía se cree de la nada". (Una concepción
alternativa podría ser que la materia se formara a expensas de la energía de
expansión del Universo, con lo cual éste se dilataría algo más despacio que
en el caso de que no existiese la creación continua.)
Suponiendo que admitimos la creación continua, pasemos ahora a examinar sus
consecuencias. La separación paulatina de las galaxias debe ser visualizada,
no como el resultado de cierta explosión, sino como la consecuencia de un
efecto más sutil. Así, por ejemplo, en 1959 Hermann Bondi y Raymond Arthur
Lyttleton especularon en torno a la posibilidad de que la carga positiva del
protón fuese muy ligeramente superior a la carga negativa del electrón. Si la
carga positiva del protón fuese superior a la carga negativa del electrón en
una trillonésima parte de ésta, tal diferencia sería demasiado exigua para
detectarla con los instrumentos más perfectos del hombre, pero ello bastaría
para acumular una carga neta de signo positivo en todas las galaxias y obligarlas
a emprender un movimiento de recesión mutuo y constante. Esta explicación del
Universo en expansión se considera, por lo general, como sumamente improbable
entre los astrónomos, pero constituye un ejemplo de la especie de causa
física (distinta de la explosión) buscada por quienes desean soslayar la
teoría del "big bang". A medida que las galaxias se apartan unas de
otras (sea cual fuere la causa), el espacio que queda entre ellas se va
llenando gradualmente de materia gracias a la creación continua. Cierto que
esta acumulación de materia es lenta, pero también lo es la velocidad con que
se alejan unas de otras las galaxias si la comparamos con los inmensos
espacios que se extienden entre ellas. Antes de que la distancia entre dos
galaxias vecinas se duplique habrán transcurrido varios evos, y para entonces
la cantidad de materia formada entre ambas será suficiente para poder
condensarse en una nueva galaxia. De este modo, conforme las primitivas
galaxias se van diseminando y aglomerándose paulatinamente en ese borde de
espesor igual al de una hoja de papel - o, como parece suponer Hoyle,
desplazándose, de algún modo, más allá del borde del Universo observable -,
la densidad de la distribución galáctica jamás decrecerá. Entre las
primitivas galaxias se formarían otras nuevas, y los dos efectos se
compensarían mutuamente. Por otra parte, la materia que se forma en el
proceso de la creación continua sería, desde luego, de naturaleza muy simple.
El fragmento de materia creado podría ser acaso un átomo de hidrógeno, o
quizá un neutrón que se descompondría en cuestión de minutos en un protón y
un electrón, que a su vez se asociarían para constituir un átomo de
hidrógeno. En cualquier caso, las nuevas galaxias, formadas a partir de
materia recién creada, serían galaxias jóvenes constituidas por hidrógeno
fresco. Lo cual viene a significar que en cualquier momento del futuro un
observador vería a su alrededor el mismo número de galaxias jóvenes que en la
actualidad. El Universo nunca llegaría a vaciarse ni a envejecer, a pesar de
que las galaxias, consideradas por separado, sí envejecen.
Si miramos retrospectivamente en el tiempo, cabe pensar que las galaxias se
aproximan entre sí, pero no tienen por qué llegar a encontrarse. En una
inversión del tiempo, la creación continua se convierte en destrucción
continua. En un Universo retrógrado como este, los átomos complejos se
desintegran en hidrógeno, y el hidrógeno a su vez desaparece. Las galaxias se
desvanecen conforme se aproximan unas a otras, sin llegar a formar nunca un
huevo cósmico. Su lugar pasan a ocuparlo otras galaxias procedentes de esa
reserva infinita que es el borde del Universo, o bien de la reserva situada
más allá de dicho borde, según el punto de vista que adoptemos. A la larga, y
por mucho que retrocedamos en el tiempo, las galaxias ni acortan sus
distancias mutuas ni rejuvenecen. En tales condiciones, el estado global del
Universo no cambia con el tiempo (ni hacia atrás ni hacia adelante), sino que
permanece estacionario. Un modelo de estas características representa un
"Universo en estado estacionario" y concuerda con el principio
cosmológico perfecto. La idea de un Universo eterno e inmortal en el que el
hombre (o la especie que evolucione a partir de él) podrá vivir para siempre,
posee sin duda un atractivo muy singular y ha causado un fuerte impacto en el
público no científico. Impacto que se ha visto acentuado por la circunstancia
de que el defensor más acérrimo de la creación continua ha sido Fred Hoyle,
escritor ameno y convincente, cuyas obras de divulgación sobre astronomía han
encontrado una excelente acogida entre el público en general. (Por otra
parte, George Gamow, el partidario más sobresaliente de la teoría del
"big bang", también es un escritor de enorme éxito en temas de
divulgación científica. Rara vez en la historia de la ciencia se ha dado un
enfrentamiento tal de titanes ante los ojos del público profano.) Bien es
verdad que en 1952, cuando Baade propuso una nueva escala para las distancias
cósmicas e hizo retroceder el tiempo cero del "big bang" hasta 6
evos o más en el pasado, el argumento más potente en favor del Universo en
estado estacionario (a saber, que el "big bang" era imposible) se
vino abajo. Para entonces, empero, la idea del Universo en estado
estacionario resultaba demasiado atractiva para abandonarla de buenas a
primeras.
Es muy difícil decidirse por uno de los modelos del Universo que hemos
presentado en este capítulo. A la hora de decidir debemos recordar que el
Universo en estado estacionario se adhiere al principio cosmológico perfecto,
mientras que los demás no. Esto significa que si fuésemos capaces de variar
nuestra posición en el tiempo, el problema quedaría resuelto. Pues si
comprobáramos que el aspecto general del Universo no cambia con el tiempo,
que las galaxias no se hallaban más juntas ni eran más jóvenes en el pasado,
ni más espaciadas y viejas en el futuro, ello supondría un punto importante a
favor de la teoría del estado estacionario. En caso contrario sería el
Universo pulsante o el hiperbólico el que se vería favorecido; la elección
entre ambos se haría entonces a partir de la amplitud del cambio a lo largo
del tiempo.
Cierto es que si la raza humana logra sobrevivir de aquí a varios evos, sin
solución de la continuidad cultural, nuestros descendientes se hallarán
entonces en lo que ahora es futuro lejano y estarán en condiciones de decidir
acerca de esta cuestión; pero sucede que los astrónomos desearían, a ser
posible, encontrar la solución ahora, aspiración, por lo demás, muy
comprensible. Así pues, lo que precisamos es un viaje en el tiempo, un viaje
temporal. Una forma de viaje temporal es, por de pronto, posible. Veamos
cómo. Cuando decimos que la galaxia de Andrómeda se halla a 2.300.000
años-luz de nosotros, queremos expresar que la luz tarda 2.300.000 años en
cruzar la distancia que separa dicha galaxia de nuestros ojos. Cuando
observamos Andrómeda, ya sea a simple vista o con ayuda de algún instrumento,
lo que vemos es la luz que abandonó dicha galaxia hace 2.300.000 años, por lo
cual no la veremos tal y como es en el momento presente, sino como era todo
ese tiempo atrás. Al estudiar la galaxia de Andrómeda nos convertimos,
efectivamente, en viajeros del tiempo que retroceden 2.300.000 años hacia el
pasado. Cuanto más lejos penetremos en el espacio, tanto más tiempo tarda la
luz en llegar hasta nosotros y tanto más habremos retrocedido en el tiempo.
Los telescopios ópticos más perfectos de que disponía el hombre en los 50-59
alcanzaban a distinguir objetos situados a una distancia de 1 ó 2 millones de
años-luz; al observarlos, los astrónomos ven esa porción del Universo tal y
como era hace 1 ó 2 evos.
Si la concepción del Universo en estado estacionario es correcta, esta
diferencia debe ser indiferente: el Universo de 1 ó 2 evos atrás tendría las
mismas propiedades generales que las del Universo de hoy día. Las galaxias
que vemos con los telescopios más potentes no deberían estar más separadas ni
más juntas de lo que están en la actualidad, deberían alejarse unas de otras
a la misma velocidad que hoy día y, en general, no deberían presentar ninguna
propiedad que las distinguiera, en conjunto, de las galaxias que observamos
en las proximidades inmediatas de nuestro sistema. Pero si la verdad
científica estuviese del lado de la concepción pulsante o hiperbólica del
Universo, entonces la diferencia de tiempo sí daría lugar a cambios
considerables: como mínimo habría algunas propiedades importantes respecto a
las cuales el borde remoto del Universo diferiría de las regiones próximas a
nosotros. Por ejemplo: las galaxias muy lejanas deberían ser más jóvenes que
las de nuestras proximidades, así como más ricas en hidrógeno, menos
espaciadas y caracterizadas por una velocidad de recesión mayor (toda vez que
la fuerza explosiva no habría sido debilitada aún por la atracción lenta y
constante de la gravedad). Por otra parte, dado que aquellas regiones
representan la juventud del Universo, podrían contener objetos que no se
encuentran en nuestra propia vecindad y que fuesen característicos únicamente
de un Universo joven. Por último, estudiando la medida en que estas
diferencias se ponen de manifiesto sería posible determinar cuál de los dos
Universos se ajusta mejor a los hechos: si el pulsante o el hiperbólico. Las
consideraciones anteriores acaso parezcan sobremanera inmediatas, pero en
realidad llevan a una frustración desesperante. Cuanto más distantes son los
objetos que estudiamos, tanto más probable es que podamos decidir entre los
distintos modelos del Universo que hemos sugerido; pero cuanto más lejanos
son dichos objetos, tanto más difícil resulta también detectar detalle
alguno. A lo más que se llegó a mediados de la década de 1950-59 fue a
estudiar los desvíos al rojo de las galaxias más distantes que se podían
detectar. En un Universo en estado estacionario la constante de Hubble
debería ser idéntica en todo momento y, por ende, para cualquier distancia.
En un Universo pulsante o hiperbólico, por el contrario, dicha constante
tiene que disminuir a medida que avanza el tiempo, tomando un valor bastante
alto durante la juventud del Universo. En ese caso, las galaxias muy
distantes (que representan dicha juventud) deberían alejarse con una
velocidad mayor y exhibir un desvío al rojo también superior a lo normal.
Hacia 1956 parecía, en efecto, que se habían observado desvíos al rojo
excesivos, lo cual constituía un argumento en contra del Universo en estado
estacionario. Sin embargo, el exceso observado era tan minúsculo y las
dificultades de observación tan grandes, que las pruebas obtenidas no fueron
ni mucho menos concluyentes. Se precisaba algo mejor. Pero ¿qué exactamente?
Para contestar a esta pregunta es necesario centrar nuestra atención en
aquellas ramas de la astronomía moderna que no dependen de la luz visible.
Llegados a este punto, la luz visible falla; otras manifestaciones del
Universo quizá no.
16. Genética y evolución.
ROSE, S: "Historia y relaciones sociales de la genética"
Las preguntas que deseamos plantear son:
1 ¿Cómo se descubrió que el gen tenía una identidad química y estaba
compuesto por ADN?
2 ¿Cómo ayudó este hecho a resolver el problema de la relación entre el gen y
su ambiente celular y la replicación de la célula?
El "camino hacia la doble hélice" no era un camino directo, sino
que se desviaba en muchas direcciones, con falsas pistas y muchas disputas
entre sus seguidores. En último término, el camino correcto hacia adelante
dependía del desarrollo de técnicas nuevas y de la elección de un organismo
experimentalmente adecuado.
De los hombres y las moscas a los microorganismos: un enzima, un gen.
La relación entre la genética y la bioquímica no fue una unión repentina
ocurrida en los años cuarenta y cincuenta, sino que ya venía de antaño. El
redescubrimiento del mendelismo en el año 1900 tuvo lugar más o menos al mismo
tiempo que el descubrimiento de la naturaleza catalítica de los enzimas
("fermentos") y la posibilidad de extraerlos de un organismo
viviente y utilizarlos para trabajar in vitro, primero en la levadura por los
hermanos Buchner y poco después también en muchos otros organismos. Muchos
biólogos estaban convencidos de que los "fermentos" proporcionarían
los datos necesarios para descifrar el proceso de la vida. De ahí había sólo
un paso hasta la idea de que los factores mendelianos funcionaban bien controlando
el tipo de fermentos producido o quizás eran fermentos ellos mismos. Los
ejemplos obvios fueron las diferencias en el color, que no eran solamente
caracteres mendelianos clásicos, sino que también se sabía que eran debidos a
la presencia o ausencia de sustancias químicas específicas, algunas de las
cuales fueron aisladas incluso antes del 1900. Sin embargo, el problema
radicaba en que si los colores eran debidos a la presencia o a la ausencia de
sustancias determinadas producidas por los genes, ¿cómo podían explicarse las
relaciones de dominancia y recesividad? Mientras que a partir de 1910 fueron
progresando los estudios realizados por Morgan sobre el cromosoma, la
cuestión de la naturaleza química de la acción génica permaneció perdida en
la corriente principal del pensamiento genético.
Sin embargo, permaneció como una línea subterránea de pensamiento,
observación y experimentación, en particular después del trabajo del físico
londinense, Archibald Garrod, que estudió varios trastornos humanos caracterizados
por la presencia de productos anormales en la orina. El caso clásico fue la
alcaptonuria, una enfermedad en la que la orina del individuo afectado se
oscurece con la exposición al aire, debido a la presencia de ácido
homogentísico. ¿Cómo va a parar el ácido homogentísico a la orina? Garrod
observó basándose en estudios epidemiológicos que la alcaptonuria parecía
afectar a familias, y por ello rechazó la idea de que el ácido homogentísico
apareciera debido a una infección microbiana; por el contrario, parecía ser,
como dijo él mismo una "rareza" del metabolismo, "una anomalía
química más o menos análoga a las malformaciones estructurales". Este
concepto se expone en el libro clásico de Garrod, Errores congénitos del
metabolismo, publicado en 1909, donde explica que en la alcaptonuria y en
otros trastornos transmitidos genéticamente, el organismo carece de ciertos
enzimas clave.
Esta hipótesis, que podía haberse asimilado mucho antes, fue no obstante
ignorada por los genéticos más formalistas. Los bioquímicos continuaron
avanzando en su trabajo, que constituyó una de las primeras conexiones entre
la bioquímica y la genética que se desarrollaron bajo la influencia de
bioquímicos como Hopkins (quien desarrolló el concepto de
"vitamina") y de fisiólogo-genéticos como Haldane.
¿Pero cómo podían seguirse estas conexiones? Los "errores
congénitos" en los humanos eran raros y no siempre aptos para el estudio
bioquímico, así que la investigación empezó por la búsqueda del organismo
adecuado para el estudio del control genético del metabolismo. Las plantas,
debido a la fácil identificación de sus pigmentos, fueron obviamente una
fuente importante pero los problemas genéticos y químicos fueron
innumerables. Con la aparición de la Drosophila [mosca del vinagre] en la
escena genética, pronto se hizo evidente que algunas de sus mutaciones podían
también servir de base para aquellos estudios, por ejemplo los mutantes de
ojos rojos, blancos y marrones.
En París, Ephrussi y Beadle empezaron a trabajar sobre embriología de
Drosophila utilizando los mutantes de pigmento de ojos y a estudiar las
consecuencias del trasplante de tejido potencial de ojo de una larva de un
tipo de mutante a larvas del otro tipo. Pero el trabajo era lento y difícil.
Drosophila no era el organismo adecuado para estos experimentos. Cuando
Beadle volvió a California invitó a un bioquímico, E. L. Tatum, a que se le
uniera. Tatum había trabajado con el moho del pan Neurospora crassa, y
parecía que podía ser un organismo mucho más adecuado, pues, debido a la
naturaleza de su ciclo vital, podía crecer en un medio simple, no requería
mucho espacio y podía ser irradiado para producir un elevado número de
mutantes. Tatum y Beadle tenían sólo que irradiar esporas asexuales de
Neurospora, cruzarlas con una cepa del tipo de apareamiento opuesto, permitir
que se produjeran las esporas sexuales, aislarlas, hacerlas crecer en un
medio suplementado apropiado y probarlas luego en el medio no suplementado.
Creían que la relación gen-enzima era general que no tenían ninguna duda de
que encontrarían los mutantes que buscaban. La única preocupación era que su
frecuencia podía ser tan baja que se vieran obligados a abandonar antes de
encontrar uno. Pero de un millar de cultivos, procedentes de una sola espora,
encontraron una espora aislada que requería vitamina B6 y otra que requería
B1. Pronto tuvieron docenas de mutantes.
En este largo y poco directo camino, primero en Drosophila y luego en
Neurospora, redescubrieron lo que Garrod ya había visto tan claramente hacía muchos
años. Tatum y Beadle pudieron demostrar que lo que Garrod había descubierto
para unos pocos genes y unas pocas reacciones en el hombre, era también
cierto para muchos genes y muchas reacciones en Neurospora.
Así se estableció el uso del crecimiento de mutantes en placa con
requerimientos nutritivos específicos, técnica clave de la genética
microbiana. El mapado genético de los microorganismos llegó a ser posible, al
igual que en Drosophila, y en los años cuarenta se formuló el famoso
principio "un enzima, un gen". El camino hacia la teoría del ADN
parecía quedar despejado, exento de dificultades ¿por qué no fue así?
Proteínas, ácidos nucleicos y virus
El problema residía aún en la naturaleza de la relación existente entre genes
y enzimas. ¿Eran los genes en sí mismos enzimas? ¿Cómo se replicaban? Las
dificultades provenían del hecho de que la naturaleza química de la
macromolécula que constituía el gen era todavía muy incierta. Hacía
relativamente poco, en los años veinte, que se había establecido que los
enzimas eran proteínas, compuestas por secuencias de aminoácidos que se unen
para formar macromoléculas cuyos pesos moleculares son del orden de cientos
de miles. Debido a que las proteínas parecían ser unas moléculas biológicas
tan importantes y, sobre todo, gracias a que las posibles permutaciones de
los 20 diferentes aminoácidos que formaban las cadenas eran astronómicamente
altas, era muy tentador argumentar que las proteínas debían ser además, el
material genético.
Al contrario de lo que sucedía con las proteínas, se conocía mucho menos
acerca de los ácidos nucleicos. Habían sido aislados químicamente en 1868 a
partir de los núcleos de células del pus recuperadas a partir de vendajes
quirúrgicos usados y más tarde se encontró que estaban presentes en todos los
tejidos, sobre todo en células con una elevada proporción de núcleo respecto
al citoplasma, como el esperma. Hubo una cierta confusión durante algunos
años porque se creía que el ADN estaba presente sólo en los animales y el ARN
sólo en las plantas y microorganismos, pero hacia finales de los años treinta
era totalmente aceptado que el ADN estaba presente en el núcleo de la célula,
estrechamente unido a algunas proteínas formando un complejo
nucleoproteínico. Pero no se había avanzado mucho en la determinación de la
estructura y composición del ADN: se sabía que contenía las cuatro bases,
adenina y guanina, citosina y timina, que se encontraban en proporciones
regulares unas respecto a otras (al contrario de lo que sucedía con la
distribución de aminoácidos en las proteínas); se hicieron sugerencias de que
las bases debían formar una secuencia regular repetida y, debido a ello, la
mayoría de bioquímicos hasta los años cuarenta creían que era probable que
los ácidos nucleicos fueran una sustancia inerte que de alguna manera
protegía a la proteína del gen. Los obstáculos en la vía de los análisis
químicos de los cromosomas persistían.
¿Podía algún otro organismo resolver el problema? Hemos visto cómo los
genéticos pasaron de los guisantes a la mosca de la fruta y al moho del pan,
en una búsqueda constante de un organismo más pequeño, cada vez menos
complejo que resolviera los problemas planteados por los organismos más
grandes. El reconocimiento de la existencia de organismos aún más pequeños, invisibles
incluso al microscopio óptico y lo suficientemente pequeños para pasar a
través de los filtros más finos, fue el paso siguiente. La manera en que
tales organismos, los virus bacterianos (fagos), funcionaban era todavía
desconocida. Muchos argumentaban que eran esencialmente un tipo especial de
enzima mientras que otros decían que de alguna manera parecían "genes
salvajes" independientes de la célula y capaces de replicarse e incluso
de ser cristalizados.
Ni siquiera los virus podían resolver el problema a menos que pudiera
estudiarse su química, y en los años treinta era evidente que también ellos
poseían una naturaleza sobre todo proteica, aparentemente
"contaminada" algunas veces de ácidos nucleicos. Muchos de los
químicos más destacados estaban a favor del modelo proteico. En 1935 apareció
un artículo en Science sobre "el aislamiento de una proteína cristalina
que poseía las propiedades del TMV (virus del mosaico del tabaco)". En
1937, Bawden y Pirie, trabajando con el TMV, fueron capaces de demostrar que
el virus estaba en realidad compuesto solamente de ácido nucleico y proteína;
pero, los experimentos no se realizaron hasta los años cincuenta. El virus,
al igual que el cromosoma, permaneció como una "paradoja rodeada de un
enigma". Aparecería una época en la historia de la genética en la que el
fago sería el organismo adecuado, pero a finales de la década de los treinta
era aún demasiado pronto.
Transformación bacteriana
Cierto trabajo realizado con bacterias proporcionaría el próximo paso hacia
adelante, trabajo realizado inicialmente por Griffith, en Londres. Este
trabajo nació de los intentos de producir un suero para el tratamiento de la
neumonía. Entre varios tipos de neumococos, Griffith observó dos, la forma S
(de "smooth") que crecían in vitro en colonias lisas, y la forma R
(de "rough") que crecían en colonias rugosas. La forma R era
no-virulenta, y parecía que durante su crecimiento sobre una placa de agar
las formas R y S podían interconvertirse. Estos cambios se parecían a los de
la mutación, una alteración de una forma en otra, que entonces ya se
transmite.
En 1928, Griffíth realizó el experimento de inyectar a ratones células no
virulentas R vivas junto con células S muertas. Los ratones se infectaban y
morían y a partir de su sangre se podían aislar colonias de células
virulentas del tipo S. Por lo tanto, debía existir algún factor en el
material de las células S muertas que cambiaba el tipo de células R. ¿Qué es
lo que era responsable de esta transformación? Tenía que ser una sustancia
que se destruyera por el calor, porque, si las células S se calentaban
alrededor de los 80 ºC, perdían su poder de transformación. Griffith tendía a
pensar que era una proteína.
Cuando en 1933 Dawson y Sia llevaron a cabo la transformación in vitro,
fueron capaces de demostrar que el principio de transformación era una
nucleoproteína. Pero ¿un ácido nucleico o una proteína? De nuevo, el clima de
opinión general apostaba en favor de la proteína. Un grupo de tres
bioquímicos del Instituto Rockefeller de Nueva York, Avery, Mac Leod y
McCarty, intentaron resolver esta cuestión utilizando enzimas purificados
para separar sustancias específicas. Hacia 1944, ya era segura la
identificación de dicha sustancia como ADN. Aunque los experimentos de Avery
fueron ampliamente reconocidos, sus implicaciones no fueron todavía
totalmente comprendidas. Esto fue debido, en parte al menos, a la
incertidumbre que existía aún acerca de la estructura del ADN y a la creencia
de que la molécula de ADN no poseía la complejidad necesaria para transportar
la información que dirigía la síntesis de las proteínas.
Estructuras de las macromoléculas
La "solución" al papel que realiza el ADN proviene de una amalgama
entre la genética, la bioquímica y la estructura molecular, y es necesario
observar cómo surgieron y se solucionaron las cuestiones estructurales.
Hacia los años veinte, la confianza de los químicos en sus técnicas se había
desarrollado hasta tal punto que estaban dispuestos a probarlas con las
sustancias biológicas más arduas -que inicialmente fueron llamadas
"coloides" y más tarde, cuando sus estructuras moleculares llegaron
a ser más claras, "macromoléculas"-. El desarrollo de la máquina
ultracentrifugadora colaboró tanto en demostrar la pureza de las
macromoléculas una vez aisladas como en determinar su peso molecular. Los
estudios químicos fueron capaces de demostrar las unidades de las que estaban
compuestas, aunque no su orden (la primera proteína secuenciada, la insulina,
no lo fue hasta 1956), y la cristalografía por rayos X proporcionó
información sobre la que podía construirse un modelo molecular preciso.
Los principales progresos en cristalografía por rayos X fueron realizados por
Astbury, en Leeds. Su trabajo estaba financiado por la industria de la lana,
para la que era grande la importancia del conocimiento de la estructura de
las fibras, y él desarrolló los métodos basados en los rayos X hasta un
elevado nivel obteniendo en poco tiempo una estructura para la proteína
queratina, y por lo tanto para la lana. Este trabajo despertó un amplio
interés entre la nueva generación de fisico-químicos interesados en problemas
biológicos, y hacia los años cuarenta proseguían los estudios sobre la
estructura de las proteínas en varios laboratorios, en particular en el laboratorio
Cavendish de Cambridge donde un joven alemán emigrado, Max Perutz, emprendió
en 1937 la enorme tarea de averiguar la estructura de la compleja proteína
sanguínea, la hemoglobina. La hemoglobina era una proteína enrollada,
globular, y obtener su estructura iba a ser claramente el trabajo de toda una
vida.
En realidad, uno de los datos para la obtención de la estructura general de
las proteínas globulares -y el ADN- no apareció hasta 1950, y no procedente
del laboratorio de Cambridge sino del de Pasadena en California, el
laboratorio del químico Linus Pauling. Pauling propuso un modelo para las
proteínas globulares en el que la cadena molecular era tridimensional y se
enrollaba formando una hélice I, parecida a un muelle. Era el famoso modelo
de la hélice I, que le hizo ganar a Pauling el premio Nobel de química. Fue a
la sombra de la hélice I de Pauling y del trabajo de Perutz sobre la
hemoglobina que hacia 1950 dos equipos de investigación empezaron a trabajar
intensamente sobre la estructura del ADN: Maurice Wilkins, del King's College
de Londres y Francis Crick y James Watson del Cavendish. Juntos representaban
la síntesis de dos escuelas diferentes que habían aparecido en biología
molecular: la primera era la escuela estructural; la segunda no estaba tan
interesada en la estructura como en lo que se llegaría a conocer como
contenido informativo de las macromoléculas, pero al igual que la escuela
estructural originó una invasión de la biología por parte de científicos
pertenecientes a otra disciplina -la física-.
Macromoléculas e información: la escuela del fago.
Hubieron varios factores que contribuyeron a que los físicos se dedicaran a
la biología en los años cuarenta. Uno de ellos era el sentimiento
experimentado por muchos de los jóvenes físicos más brillantes de que la
física clásica y cuántica se estaba empezando a agotar y que las cuestiones
interesantes residían en algún otro lugar, quizás en la biología. Desde la
hipótesis reduccionista de la física, muchos creían que los problemas
biológicos se resolverían pronto. Otros sostenían un punto de vista
alternativo según el cual en el estudio de la biología se revelarían leyes
nuevas que serían totalmente diferentes de las de la física clásica. Tuvo
gran influencia un libro publicado en 1944 por un importante físico alemán
que vivía en el exilio en Irlanda, uno de los que creía que la biología
revelaría nuevas leyes físicas. Era Erwin Schrödinger. En ¿Qué es la vida?
Schrödinger, considerando el flujo inestable y de corta vida de los
acontecimientos a nivel subatómico en física y la extrema estabilidad de los
organismos vivos y la preservación de sus caracteres a través de muchas
generaciones, concluyó que la información necesaria para retener estos
caracteres debía estar contenida de alguna manera en los enlaces covalentes
de "un cristal aperiódico gigante", que denominó "el código
hereditario". Este libro atrajo la imaginación de muchas personas, entre
ellas Crick, Watson, Delbrück, Luria y Benzer.
Había también otra razón para pasarse de la física a la biología al ir
avanzando los años cuarenta; muchos de los físicos más jóvenes se encontraron
atrapados en la guerra de 1939-1945, particularmente en la construcción de la
bomba atómica. Con la tormenta de cuestiones morales y políticas que surgió acerca
del uso de la misma se fue creando un clima de repulsión. "La física
está por la muerte, la biología por la vida", como decía uno de los que
cambió de disciplina en aquella época.
El cambio se realizó y, para un grupo, los puntos focales fueron el exalemán
y exfísico Max Delbrück que trabajaba en Pasadena, California, y un organismo
nuevo, el fago. Delbrück y Salvador Luria en el Instituto de Tecnología de
Massachusetts (MIT) y Alfred Hershey en el Cold Spring Harbor formaron el
núcleo de lo que se conoció como la escuela del fago.
Algunos de los factores clave que condujeron a un nuevo avance tenían que ver
con la organización; este grupo estaba realmente interesado en planear, hacer
y discutir experimentos y teorías colectivamente, y, por lo tanto, era capaz
de concentrarse en los temas centrales con gran eficacia. Delbrück sugirió
que todos debían trabajar con los fagos que atacan a Escherichia coli y no
dispersar esfuerzos en muchos sistemas. Otro avance importante fue el
desarrollo de las nuevas técnicas, sobre todo la microscopía electrónica, que
hizo realmente posible "observar" las partículas víricas y los
marcadores radiactivos. La primera micrografía electrónica de un fago fue
realizada a finales de los años cuarenta y pronto aparecieron fotografías de
fagos invadiendo al huésped bacteriano. Hershey sugirió que quizás el fago
era como una pequeña jeringa de proteína llena de ADN vírico, diseñada para
que pudiera unirse a la célula huésped e inyectar el ADN en ella.
Hershey y Martha Chase quisieron comprobar esta idea experimentalmente en
1951-1952. Para ello marcaron los fagos radiactivamente, algunos con S35
(isótopo radioactivo de azufre) en la cisteína o metionina de su proteína y
otros con fosfatos de P32 en su ácido nucleico. Pudieron demostrar que el 90
% de la proteína marcada radiacti-vamente permanecía fuera de la bacteria,
mientras que el 85 % del ADN marcado penetraba en ella. Este experimento se
consideró, de forma general, como la prueba concluyente del papel del ADN.
Mientras tanto, en 1949, empezó otra línea de trabajo, en la que estaba
implicada la escuela del fago, cuando André Lwoff del Instituto Pasteur de
París empezó a trabajar sobre la lisogenia en Bacillus megaterium, y
siguiendo su sugerencia, Jacques Monod empezó a mostrar interés por el
fenómeno que iba a dar lugar al modelo del operón (región del cromosoma donde
están los genes que dirigen la síntesis de las enzimas).
El ADN: la doble hélice
Es importante observar que este descubrimiento no fue la consecuencia de una
idea luminosa sino el resultado de varias décadas de trabajo de muchos
laboratorios. Si Watson y Crick no hubiesen averiguado su estructura, se
habría conseguido inevitablemente en algún otro lugar al cabo de pocos meses.
Los datos estructurales a partir de los estudios de difracción por rayos X
estaban allí, y el papel clave de las moléculas del ADN en genética era
demasiado evidente a principios de los años cincuenta para permanecer oculto
durante un período de tiempo largo. El encuentro de estos dos hombres en un
laboratorio determinado, en un tiempo determinado, es un final apropiado y
simbólico para un capítulo - lo que ha sido denominado período romántico de
la biología molecular - y el comienzo de otro, el período
"dogmático".
|