Facebook Twitter Google +1     Admin

¿Y esta publicidad? Puedes eliminarla si quieres.

Se muestran los artículos pertenecientes al tema Matemáticas.

MATEMÁTICAS: EL NÚMERO AUREO. El número áureo o de oro (también llamado número plateado, razón extrema y media,[1] razón áurea, razón dorada, media áurea, proporción áurea y divina proporción) representado por la letra griega φ (fi) (en minúscula) o Φ (fi) (en mayúscula), en honor al escultor griego Fidias, es un número irracional.

Número áureo

De Wikipedia, la enciclopedia libre
Una sección áurea es una división en dos de un segmento según proporciones dadas por el número áureo. La longitud total a+b es al segmento más largo a como a es al segmento más corto b.


El número áureo o de oro (también llamado número plateado, razón extrema y media,[1] razón áurea, razón dorada, media áurea, proporción áurea y divina proporción) representado por la letra griega φ (fi) (en minúscula) o Φ (fi) (en mayúscula), en honor al escultor griego Fidias, es un número irracional:[2]

varphi = frac{1 + sqrt{5}}{2} approx                 1.618033988749894848204586834365638117720309  ...

También se representa con la letra griega Tau (Τ τ),[3] por ser la primera letra de la raíz griega τομή, que significa acortar, aunque encontrarlo representado con la letra Fi (Φ,φ) es más común.

Se trata de un número algebraico irracional (decimal infinito no periódico) que posee muchas propiedades interesantes y que fue descubierto en la antigüedad, no como “unidad” sino como relación o proporción entre segmentos de rectas. Esta proporción se encuentra tanto en algunas figuras geométricas como en la naturaleza en elementos tales como caracolas, nervaduras de las hojas de algunos árboles, el grosor de las ramas, etc.

Asimismo, se atribuye un carácter estético especial a los objetos que siguen la razón áurea, así como una importancia mística. A lo largo de la historia, se le ha atribuido importancia en diversas obras de arquitectura y otras artes, aunque algunos de estos casos han sido objetables para las matemáticas y la arqueología.

Contenido

[ocultar]
//

[editar] Definición

Números
γ - ζ(3) - √2 - √3 - √5 - φ - α - e - π - δ
Binario1,1001111000110111011...
Decimal1,6180339887498948482...
Hexadecimal1,9E3779B97F4A7C15F39...
Fracción continua1 + frac{1}{1 + frac{1}{1 + frac{1}{1 + frac{1}{ddots}}}}
Algebraicofrac{1 + sqrt{5}}{2}

Se dice que dos números positivos a y b están en razón áurea si y sólo si:

frac{a + b}{a} = frac{a}{b} = varphi

Para obtener el valor de varphi a partir de esta razón considere lo siguiente:

Que la longitud del segmento más corto b sea 1 y que la de a sea x. Para que estos segmentos cumplan con la razón áurea deben cumplir que:

frac{1 + x}{x} = frac{x}{1}

Multiplicando ambos lados por x y reordenando:

 x^2 - x -1 = 0

Mediante la fórmula general de las ecuaciones de segundo grado se obtiene que las dos soluciones de la ecuación son

x_1 = frac{1 + sqrt{5}}{2} = varphi approx 1,61803

x_2 = frac{1 - sqrt{5}}{2} = -frac{1}{varphi} approx -0,61803

La solución positiva es el valor del número áureo.

[editar] Historia del número áureo

Existen varios textos que sugieren que el número áureo se encuentra como proporción en ciertas estelas Babilonias y Asirias de alrededor de 2000 a. C. Sin embargo, no existe documentación histórica que indique que el número áureo fue usado conscientemente por los arquitectos o artistas en la construcción de las estelas. También es importante notar que cuando se mide una estructura complicada es fácil obtener resultados curiosos si se tienen muchas medidas disponibles. Además para que se pueda considerar que el número áureo está presente, las medidas deben tomarse desde puntos relativamente obvios del objeto y este no es el caso de los elaborados teoremas que defienden la presencia del número áureo. Por todas estas razones Mario Livio y Álvaro Valarezo concluyen que es muy improbable que los babilonios hayan descubierto el número áureo.[4]

El primero en hacer un estudio formal sobre el número áureo fue Euclides (c. 300-265 a. C.), quién lo definió de la siguiente manera:

"Se dice que una línea recta está dividida en el extremo y su proporcional cuando la línea entera es al segmento mayor como el mayor es al menor."
Euclides en Los Elementos.

Euclides demostró también que este número no puede ser descrito como la razón de dos números enteros, es decir es irracional.

Platón (c. 428-347 a. C.) vivió antes de que Euclides estudiara el número áureo, sin embargo, a veces se le atribuye el desarrollo de teoremas relacionados con el número áureo debido que el historiador griego Proclo escribió:

"Eudoxo... multiplicó el número de teoremas relativos a la sección a los que Platón dio origen."
Proclo en Un comentario sobre el Primer Libro de los Elementos de Euclides.

Aquí a menudo se interpretó la palabra sección (τομή) como la sección áurea. Sin embargo a partir del siglo XIX esta interpretación ha sido motivo de gran controversia y muchos investigadores han llegado a la conclusión de que la palabra sección no tuvo nada que ver con el número áureo. No obstante, Platón consideró que los números irracionales, descubiertos por los pitagóricos, eran de particular importancia y la llave a la física del cosmos. Esta opinión tuvo una gran influencia en muchos filósofos y matemáticos posteriores, en particular los neoplatónicos.

A pesar de lo discutible de su conocimiento sobre el número áureo, Platón se dio a la tarea de estudiar el origen y la estructura del cosmos, cosa que intentó usando los cinco sólidos platónicos, construidos y estudiados por Teeteto. En particular, combinó la idea de Empédocles sobre la existencia de cuatro elementos básicos de la materia, con la teoría atómica de Demócrito. Para Platón cada uno de los sólidos correspondía a una de las partículas que conformaban cada uno de los elementos: la tierra estaba asociada al cubo, el fuego al tetraedro, el aire al octaedro, el agua al icosaedro, y finalmente el Universo como un todo, estaba asociado con el dodecaedro.

En 1509 el matemático y teólogo Luca Pacioli publica su libro De Divina Proportione (La Proporción Divina), en el que plantea cinco razones por las que considera apropiado considerar divino al Número áureo:

  1. La unicidad; Pacioli compara el valor único del número áureo con la unicidad de Dios.
  2. El hecho de que esté definido por tres segmentos de recta, Pacioli lo asocia con la Trinidad.
  3. La inconmensurabilidad; para Pacioli la inconmensurabilidad del número áureo, y la inconmensurabilidad de Dios son equivalentes.
  4. La Autosimilaridad asociada al número áureo; Pacioli la compara con la omnipresencia e invariabilidad de Dios.
  5. Según Pacioli, de la misma manera en que Dios dio ser al Universo a través de la quinta esencia, representada por el dodecaedro; el número áureo dio ser al dodecaedro.

En 1525, Alberto Durero publica Instrucción sobre la medida con regla y compás de figuras planas y sólidas donde describe cómo trazar con regla y compás la espiral basada en la sección áurea, que se conoce como “espiral de Durero”.

El astrónomo Johannes Kepler (1571-1630), desarrolló un modelo Platónico del Sistema Solar utilizando los sólidos platónicos, y se refirió al número áureo en términos grandiosos

La geometría tiene dos grandes tesoros: uno es el teorema de Pitágoras; el otro, la división de una línea entre el extremo y su proporcional. El primero lo podemos comparar a una medida de oro; el segundo lo debemos denominar una joya preciosa
Johannes Kepler en Mysterium Cosmographicum (El Misterio Cósmico).

El primer uso conocido del adjetivo áureo, dorado, o de oro, para referirse a este número lo hace el matemático alemán Martin Ohm, hermano del célebre físico Georg Simon Ohm, en la segunda edición de 1835 de su libro Die Reine Elementar Matematik (Las Matemáticas Puras Elementales). Ohm escribe en una nota al pie:

"Uno también acostumbra llamar a esta división de una línea arbitraria en dos partes como éstas la sección dorada."
Martin Ohm en Die Reine Elementar Matematik (Las Matemáticas Puras Elementales).

A pesar de que la forma de escribir sugiere que el término ya era de uso común para la fecha, el hecho de que no lo incluyera en su primera edición sugiere que el término pudo ganar popularidad alrededor de 1830.

En los textos de matemáticas que trataban el tema, el símbolo habitual para representar el número áureo fue τ del griego τομή que significa corte o sección. Sin embargo, la moderna denominación Φ ó φ, la efectuó en 1900 el matemático Mark Barr en honor a Fidias ya que ésta era la primera letra de su nombre escrito en griego (Φειδίας). Este honor se le concedió a Fidias por el máximo valor estético atribuido a sus esculturas, propiedad que ya por entonces se le atribuía también al número áureo. Mark Barr y Schooling fueron responsables de los apéndices matemáticos del libro The Curves of Live, de Sir Theodore Cook.

[editar] El número áureo en las Matemáticas

[editar] Fórmula de la relación Áurea

Para conseguir un número cuya relación con otro sea φ se puede utilizar esta fórmula:

 a^{2} = b^{2}+ab

Siendo siempre a>b, a>0 y b>0

Si por ejemplo, queremos un valor áureo para 2 siendo éste el segmento menor, o sea b, resulta que:

 a^2 = 4 + 2a

Ordenando:

 a^2 - 2a -4 = 0

Con la fórmula Cuadrática:

a = 1 + sqrt{5}

[editar] Propiedades y representaciones

[editar] Ángulo de oro

{frac{360^circ}{varphi+{1}}} approx 137{,}5^circ

[editar] Propiedades algebraicas

varphi^2 = varphi + 1

La expresión anterior es fácil de comprobar:

varphi^2 = frac{1 + 2sqrt{5} + 5}{2^2} = frac{6 + 2sqrt{5}}{2^2} = frac{3 + sqrt{5}}{2}varphi + 1 = frac{1 + sqrt{5}}{2} + frac{2}{2} = frac{3 + sqrt{5}}{2}
  • Φ posee además las siguientes propiedades:
varphi - 1 = frac{1}{varphi}  varphi^3 = frac {varphi + 1} {{varphi - 1}}
  • Las potencias del número áureo pueden ser escritas en función de una suma de potencias de grados inferiores del mismo número, estableciendo una verdadera sucesión recurrente de potencias.

El caso más simple es: Φn = Φn − 1 + Φn − 2, cualquiera sea n un número entero. Este caso es una sucesión recurrente de orden k = 2, pues se recurre a dos potencias anteriores.

Una ecuación recurrente de orden k tiene la forma a1un + k − 1 + a2un + k − 2 + ... + akun, donde ai es cualquier número real o complejo y k es un número natural menor o igual a n y mayor o igual a 1. En el caso anterior es k = 2, a1 = 1 y a2 = 1.

Pero podemos «saltear» la potencia inmediatamente anterior y escribir:

Φn = Φn − 2 + 2Φn − 3 + Φn − 4. Aquí k = 4, a1 = 0, a2 = 1, a3 = 2 y a4 = 1.

Si anulamos a las dos potencias inmediatamente anteriores, también hay una fórmula recurrente de orden 6:

Φn = Φn − 3 + 3Φn − 4 + 3Φn − 5 + Φn − 6

En general:

Phi^n = sum_{i=0}^{textstyle frac {1}{2} k}{textstyle   frac{1}{2}kchoose i}Phi^{left [textstyle n-left(textstyle frac{1}{2}k+iright)right]}textstyle;k=2jin mathbb{N},textstyle, nin mathbb{N},textstyle, iin mathbb{N}.

En resumen: cualquier potencia del número áureo puede ser considerada como el elemento de una sucesión recurrente de órdenes 2, 4, 6, 8, ..., 2k; donde k es un número natural. En la fórmula recurrente es posible que aparezcan potencias negativas de Φ, hecho totalmente correcto. Además, una potencia negativa de Φ corresponde a una potencia positiva de su inverso, la sección áurea.

Este curioso conjunto de propiedades y el hecho de que los coeficientes significativos sean los del binomio, parecieran indicar que entre el número áureo y el número e hay un parentesco.

 

  • El número áureo frac{sqrt{5} + 1}{2} es la unidad fundamental «ε» del cuerpo mathbb{R}left(sqrt{5}right) y la sección áurea frac{sqrt{5} - 1}{2} es su inversa, «varepsilon^{-1}». En esta extensión el «emblemático» número irracional sqrt{2} cumple las siguientes igualdades:

sqrt{2}=frac{sqrt{5}+1}{2}sqrt{3-sqrt{5}}=frac{sqrt{5}-1}{2}sqrt{3+sqrt{5}}.

[editar] Representación mediante fracciones continuas

La expresión mediante fracciones continuas es:

varphi = 1 + frac{1}{varphi} quad longrightarrow quad varphi = 1 + frac{1}{1 + frac{1}{1 + frac{1}{1 + frac{1}{1 + ...}}}}

Esta iteración es la única donde sumar es multiplicar y restar es dividir. Es también la más simple de todas las fracciones continuas y la que tiene la convergencia más lenta. Esa propiedad hace que además el número áureo sea un número mal aproximable mediante racionales que de hecho alcanza el peor grado de aproximabilidad mediante racionales posible.[5]

Por ello se dice que φ es el número más alejado de lo reacional o el número más irracional. Este es el motivo por el cual aparece en el teorema de Kolmogórov-Arnold-Moser.

[editar] Representación mediante ecuaciones algebraicas

(varphi)(varphi - 1) = 1 quad longrightarrow quad (varphi)^2 - varphi - 1 = 0 quad longrightarrow quad varphi = frac{1 + sqrt{5}}{2}

El número áureo frac{sqrt{5} + 1}{2} y la sección áurea frac{sqrt{5} - 1}{2} son soluciones de las siguientes ecuaciones:

 x^2 - sqrt{5}, x + 1 = 0

 x^3 - y^3 - 4 = 0

 x^4 - 3 x^2 + 1 = 0 = (x^2 - x - 1) (x^2 + x - 1)

[editar] Representación trigonométrica

varphi = 1+2sin(pi/10) = 1 + 2sin 18^circvarphi = {1 over 2}csc(pi/10) = {1 over 2}csc 18^circvarphi = 2cos(pi/5)=2cos 36^circ varphi = frac{1}{2} sec frac{2}{5} , pi = frac{1}{2} sec 72^circ varphi = frac{sin(2pi/5)}{sin(1pi/5)} , = frac{sin(72^circ)}{sin(36^circ)}

Éstas corresponden al hecho de que el diámetro de un pentágono regular (distancia entre dos vértices no consecutivos) es φ veces la longitud de su lado, y de otras relaciones similares en el pentagrama.

En 1994 se derivaron las siguientes ecuaciones relacionando al número áureo con el número de la Bestia:

frac{varphi}{2}=-sin666^circ=-cos(6cdot 6 cdot 6^circ).

Lo que puede combinarse en la expresión:

varphi=-sin666^circ-cos(6cdot 6 cdot 6^circ).

Sin embargo, hay que notar que estas ecuaciones dependen de que se elijan los grados sexagesimales como unidad angular, ya que las ecuaciones no se mantienen para unidades diferentes.

[editar] Representación mediante raíces anidadas

varphi = sqrt{1 + varphi} quad longrightarrow quad varphi = sqrt{1 + sqrt{1 + sqrt{1 + sqrt{1 +cdots }}}}

Esta fórmula como caso particular de una identidad general publicada por Nathan Altshiller-Court, de la Universidad de Oklahoma, en la revista American Mathematical Monthly, 1917.

El teorema general dice:

La expresión lim_{n to infty} sqrt{a_1 + sqrt{a_2 + sqrt{a_3 + sqrt{a_4 +sqrt{cdots + sqrt{a_n}}}}}} (donde ai = a), es igual a la mayor de las raíces de la ecuación x² - x - a = 0; o sea, frac {1 + sqrt{1 + 4a}}{2}

[editar] Relación con la serie de Fibonacci

Si se denota el enésimo número de Fibonacci como Fn, y al siguiente número de Fibonacci, como Fn + 1, descubrimos que a medida que n aumenta, esta razón oscila siendo alternativamente menor y mayor que la razón áurea. Podemos también notar que la fracción continua que describe al número áureo produce siempre números de Fibonacci a medida que aumenta el número de unos en la fracción. Por ejemplo: textstyle frac{3}{2}= 1,5 ; textstyle frac{8}{5} = 1,6 ; y textstyle frac{21}{13}= 1,61538461..., lo que se acerca considerablemente al número áureo. Entonces se tiene que:

varphi = 1 + frac{1}{1 + frac{1}{1 + frac{1}{1 + frac{1}{1 + ...}}}} = lim_{n to infty}frac{F_{n +1}}{F_n} = phi

Esta propiedad fue descubierta por el astrónomo alemán Johannes Kepler, sin embargo, pasaron más de cien años antes de que fuera demostrada por el matemático inglés Robert Simson.

Con posterioridad se encontró que cualquier sucesión aditiva recurrente de orden 2 tiende al mismo límite. Por ejemplo, si tomamos dos números naturales arbitrarios, como pudieran ser 3 y 7, la sucesión recurrente resulta: 3 - 7 - 10 - 17 - 27 - 44 - 71 - 115 - 186 - 301 ... Los cocientes de términos sucesivos producen aproximaciones racionales que se acercan asintóticamente por exceso y por defecto al mismo límite: 44/27 = 1,6296296...; 71/44 = 1,613636...; 301/186 = 1,6182795... [6]

A mediados del siglo XIX el matemático francés Jacques Philippe Marie Binet redescubrió una fórmula que aparentemente ya era conocida por Leonhard Euler, y por otro matemático francés, Abraham de Moivre. La fórmula permite encontrar el enésimo número de Fibonacci sin la necesidad de producir todos los números anteriores. La fórmula de Binet depende exclusivamente del número áureo:

F_n = frac{1}{sqrt{5}} left [ left (frac{1 +sqrt{5}}{2} right )^n - left (frac{1 - sqrt{5}}{2}right )^n right ]quad=frac{1}{sqrt{5}} left [ left ( phi right )^n - left (frac{-1}{phi} right )^n right ] quad

[editar] El número áureo en la geometría

El número áureo y la sección áurea están presentes en todos los objetos geométricos regulares o semiregulares en los que haya simetría pentagonal, pentágonos o aparezca de alguna manera la raíz cuadrada de cinco.

  • Relaciones entre las partes del pentágono.
  • Relaciones entre las partes del pentágono estrellado, pentáculo o pentagrama.
  • Relaciones entre las partes del decágono.
  • Relaciones entre las partes del dodecaedro y del icosaedro.

[editar] El rectángulo áureo de Euclides

Euclides obtiene el rectángulo áureo AEFD a partir del cuadrado ABCD. El rectángulo BEFC es asimismo áureo.

El rectángulo AEFD es áureo porque sus lados AE y AD están en la proporción del número áureo. Euclides en su proposición 2.11 de Los elementos obtiene su construcción.>

 GC = sqrt{5}

Con centro en G se obtiene el punto E, y por lo tanto

GE=GC=sqrt{5}

resultando evidente que

 AE = AG + GE = 1 + sqrt{5}

de donde, finalmente

frac{AE}{AD} = frac{1 + sqrt{5}}{2}= varphi

Por otra parte, los rectángulos AEFD y BEFC son semejantes, de modo que este último es asimismo un rectángulo áureo.

[editar] En el pentagrama

Pentagrama que ilustra algunas de las razones áureas: los segmentos rojo y azul, azul y verde, verde y morado.

El número áureo tiene un papel muy importante en los pentágonos regulares y en los pentagramas. Cada intersección de partes de un segmento, interseca a otro segmento en una razón áurea.

El pentagrama incluye diez triángulos isóceles: cinco acutángulos y cinco obtusángulos. En ambos, la razón de lado mayor y el menor es φ. Estos triángulos se conocen como los triángulos áureos.

Teniendo en cuenta la gran simetría de este símbolo se observa que dentro del pentágono interior es posible dibujar una nueva estrella, con una recursividad hasta el infinito. Del mismo modo, es posible dibujar un pentágono por el exterior, que sería a su vez el pentágono interior de una estrella más grande. Al medir la longitud total de una de las cinco líneas del pentáculo interior, resulta igual a la longitud de cualquiera de los brazos de la estrella mayor, o sea Φ. Por lo tanto el número de veces en que aparece el número áureo en el pentagrama es infinito al anidar infinitos pentagramas.

[editar] El teorema de Ptolomeo y el pentágono

Se puede calcular el número áureo usando el teorema de Ptolomeo en un pentágono regular.

Claudio Ptolomeo desarrolló un teorema conocido como el teorema de Ptolomeo, el cual permite trazar un pentágono regular mediante regla y compás. Aplicando este teorema un cuadrilátero es formado al quitar uno de los vértices del pentágono, Si las diagonales y la base mayor miden b, y los lados y la base menor miden a, resulta que b2 = a2 + ab lo que implica:

{b over a}={{(1+sqrt{5})}over 2},.

[editar] Relación con los sólidos platónicos

El número áureo está relacionado con los sólidos platónicos, en particular con el icosaedro y el dodecaedro, cuyas dimensiones están dadas en términos del número áureo. Los 12 vértices de un icosaedro con aristas de longitud 2, pueden darse en coordenadas cartesianas por los siguientes puntos: (0, ±1, ±φ), (±1, ±φ, 0), (±φ, 0, ±1)

Los 20 vértices de un dodecaedro con aristas de longitud 2/φ=√5−1, también se pueden dar en términos similares: (±1, ±1, ±1), (0, ±1/φ, ±φ), (±1/φ, ±φ, 0), (±φ, 0, ±1/φ)

Las 12 esquinas de los rectángulos coinciden con los centros de las caras de un dodecaedro.

Para un dodecaedro con aristas de longitud a, su volumen y su área total se pueden expresar también en términos del número áureo:

A = 3sqrt{15 +20varphi} cdot a^2V = frac {4 + 7varphi}{2} cdot a^3

Si tres rectángulos áureos se solapan paralelamente en sus centros, las 12 esquinas de los rectángulos áureos coinciden exactamente con los vértices de un icosaedro, y con los centros de las caras de un dodecaedro:

El punto que los rectángulos tienen en común es el centro tanto del dodecaedro como del icosaedro.

[editar] El número áureo en la Naturaleza

En la naturaleza, hay muchos elementos relacionados con la sección áurea y/o los números de Fibonacci:

  • Leonardo de Pisa (Fibonacci), en su Libro de los ábacos (Liber abacci, 1202, 1228), usa la sucesión que lleva su nombre para calcular el número de pares de conejos n meses después de que una primera pareja comienza a reproducirse (suponiendo que los conejos están aislados por muros, se empiezan a reproducir cuando tienen dos meses de edad, tardan un mes desde la fecundación hasta la aparición y cada camada es de dos conejos). Este es un problema matemático puramente independiente de que sean conejos los involucrados. En realidad, el conejo común europeo tiene camadas de 4 a 12 individuos y varias veces al año, aunque no cada mes, pese a que la preñez dura 32 días. El problema se halla en las páginas 123 y 124 del manuscrito de 1228, que fue el que llegó hasta nosotros, y parece que el planteo recurrió a conejos como pudiera haber sido a otros seres; es un soporte para hacer comprensible una incógnita, un acertijo matemático . El cociente de dos términos sucesivos de la Sucesión de Fibonacci tiende a la sección áurea o al número áureo si la fracción resultante es propia o impropia, respectivamente. Lo mismo sucede con toda sucesión recurrente de orden dos, según demostraron Barr y Schooling en la revista The Field del 14 de diciembre de 1912.[7]
  • La relación entre la cantidad de abejas macho y abejas hembra en un panal.
  • La disposición de los pétalos de las flores (el papel del número áureo en la botánica recibe el nombre de Ley de Ludwig).
  • La distribución de las hojas en un tallo. Ver: Sucesión de Fibonacci.
  • La relación entre las nervaduras de las hojas de los árboles
  • La relación entre el grosor de las ramas principales y el tronco, o entre las ramas principales y las secundarias (el grosor de una equivale a Φ tomando como unidad la rama superior).
  • La distancia entre las espirales de una Piña.
  • La relación entre la distancia entre las espiras del interior espiralado de cualquier caracol o de cefalópodos como el nautilus. Hay por lo menos tres espirales logarítmicas más o menos asimilables a proporciones aúreas. La primera de ellas se caracteriza por la relación constante igual al número áureo entre los radiovectores de puntos situados en dos evolutas consecutivas en una misma dirección y sentido. Las conchas del Fusus antiquus, del Murex, de Scalaria pretiosa, de Facelaria y de Solarium trochleare, entre otras, siguen este tipo de espiral de crecimiento.[8] [9] Se debe entender que en toda consideración natural, aunque involucre a las ciencias consideradas más matemáticamente desarrolladas, como la Física, ninguna relación o constante que tenga un número infinito de decimales puede llegar hasta el límite matemático, porque en esa escala no existiría ningún objeto físico. La partícula elemental más diminuta que se pueda imaginar es infinitamente más grande que un punto en una recta. Las leyes observadas y descriptas matemáticamente en los organismos las cumplen transgrediéndolas orgánicamente.[10]
  • Para que las hojas esparcidas de una planta (Ver Filotaxis) o las ramas alrededor del tronco tengan el máximo de insolación con la mínima interferencia entre ellas, éstas deben crecer separadas en hélice ascendente según un ángulo constante y teóricamente igual a 360º (2 - φ) ≈ 137º 30' 27,950 580 136 276 726 855 462 662 132 999..." En la naturaleza se medirá un ángulo práctico de 137º 30' o de 137º 30' 28" en el mejor de los casos. Para el cálculo se considera iluminación vertical y el criterio matemático es que las proyecciones horizontales de unas sobre otras no se recubran exactamente. Aunque la iluminación del Sol no es, en general, vertical y varía con la latitud y las estaciones, esto garantiza el máximo aprovechamiento de la luz solar. Este hecho fue descubierto empíricamente por Church y confirmado matemáticamente por Weisner en 1875. En la práctica no puede medirse con tanta precisión el ángulo y las plantas lo reproducen "orgánicamente"; o sea, con una pequeña desviación respecto al valor teórico.
  • En la cantidad de elementos constituyentes de las espirales o dobles espirales de las inflorescencias, como en el caso del girasol, y en otros objetos orgánicos como las piñas de los pinos se encuentran números pertenecientes a la sucesión de Fibonacci. El cociente de dos números sucesivos de esta sucesión tiende al número áureo.
  • Existen cristales de Pirita dodecaédricos pentagonales (piritoedros) cuyas caras son pentágonos irregulares. Sin embargo, las proporciones de dicho poliedro irregular no involucran el número áureo.
  • El número áureo en el cine:

El número Fi aparece en la película de Disney "Donald en el país de las Matemágicas"

[editar] El número áureo en el ser humano

  • La Anatomía de los humanos se basa en una relación Φ estadística y aproximada, así vemos que:
    • La relación entre la altura de un ser humano y la altura de su ombligo.
    • La relación entre la distancia del hombro a los dedos y la distancia del codo a los dedos.
    • La relación entre la altura de la cadera y la altura de la rodilla.
    • La relación entre el primer hueso de los dedos (metacarpiano) y la primera falange, o entre la primera y la segunda, o entre la segunda y la tercera, si dividimos todo es Φ.
    • La relación entre el diámetro de la boca y el de la nariz
    • Es Φ la relación entre el diámetro externo de los ojos y la línea inter-pupilar
    • Cuando la tráquea se divide en sus bronquios, si se mide el diámetro de los bronquios por el de la tráquea se obtiene Φ, o el de la aorta con sus dos ramas terminales (ilíacas primitivas).

[editar] El número áureo en el Arte

  • Relaciones en la forma de la Gran Pirámide de Gizeh. La afirmación de Heródoto de que el cuadrado de la altura es igual a la superficie de una cara es posible únicamente si la semi-sección meridiana de la pirámide es proporcional al triángulo rectángulo left( 1,;sqrt{frac{sqrt{5} + 1}{2}},;frac{sqrt{5} + 1}{2}right), donde 1 representa proporcionalmente a la mitad de la base, la raíz cuadrada del número áureo a la altura hasta el vértice (inexistente en la actualidad) y el número áureo o hipotenusa del triángulo a la apotema de la Gran Pirámide. Esta tesis ha sido defendida por los matemáticos Jarolimek, K. Kleppisch y W. A. Price (ver referencias), se apoya en la interpretación de un pasaje de Heródoto (Historiae, libro II, cap. 124) y resulta teóricamente con sentido, aunque una construcción de semejante tamaño deba contener errores inevitables a toda obra arquitectónica y a la misma naturaleza de la tecnología humana, que en la práctica puede manejar únicamente números racionales. Los demás investigadores famosos se inclinan por la hipótesis de que los constructores intentaron una cuadratura del círculo, pues la raíz cuadrada del número áureo se aproxima mucho al cociente de 4 sobre π. Pero una construcción tal, aunque se conociera π con una aproximación grande, carecería completamente de interés geométrico.[11] No obstante, con base en mediciones no es posible elegir entre una u otra pues la diferencia sobre el monumento real no es mayor a 14,2 cm y esta pequeña variación queda enmascarada por las incertidumbres de las medidas, los errores constructivos y, principalmente, porque la pirámide perdió el revestimiento en manos de los primeros constructores de El Cairo. Para que esto quede más claro, una precisión del 1 por mil en una base de 230 metros equivale a 23 centímetros y en la altura está en el orden de la diferencia real que debería existir entre ambas posibilidades.
  • La relación entre las partes, el techo y las columnas del Partenón, en Atenas (s. V a. C.).Durante el primer cuarto del siglo XX, Jay Hambidge, de la Universidad de Yale, se inspiró en un pasaje del Teeteto de Platón para estudiar las proporciones relativas de las superficies, algo muy natural cuando se trata de obras arquitectónicas. Dos rectángulos no semejantes se distinguen entre sí por el cociente de su lado mayor por el menor, número que basta para caracterizar a estas figuras y que denominó módulo del rectángulo. Un cuadrado tiene módulo 1 y el doble cuadrado módulo 2. Aquellos rectángulos cuyos módulos son números enteros o racionales fueron denominados "estáticos" y los que poseen módulos irracionales euclidianos, o sea, expresables algebraicamente como raíces de ecuaciones cuadráticas o reducibles a ellas, "dinámicos". El doble cuadrado es a la vez estático y dinámico, pues 2 es la raíz cuadrada de 4. Un ejemplo de rectángulo dinámico elemental es aquel que tiene por lado mayor a la raíz cuadrada de 5 y por lado menor a la unidad, siendo su módulo la raíz cuadrada de 5.[12] Posteriormente Hambidge estudió a los monumentos y templos griegos y llegó a encuadrar el frontón del Partenón en un rectángulo de módulo  frac {4Phi  - 2}{Phi  + 1}. Por medio de cuatro diagonales suministra las principales proporciones verticales y horizontales. Este rectángulo es descompuesto en seis de módulo  sqrt {5} y cuatro cuadrados.[13] Como dato adicional para indicar la complejidad del tratamiento del edificio se tiene que en 1837 fueron descubiertas correcciones ópticas en el Partenón. El templo tiene tres vistas principales y si sus columnas estuvieran efectivamente a plomo, todas sus líneas fuesen paralelas y perfectamente rectas y los ángulos rectos fueran exactos, por las propiedades de la visión humana el conjunto se vería más ancho arriba que en la base, sus columnas se percibirían inclinadas hacia afuera y la línea que fundamenta el techo sobre las columnas se vería como una especie de catenaria, con los extremos del edificio aparentemente más altos que el centro. Los constructores hicieron la construcción compensando estos efectos de ilusión óptica inclinando o curvando en sentido inverso a los elementos involucrados. Así las columnas exteriores, en ambos lados del frente, están inclinadas hacia adentro en un ángulo de 2,65 segundos de arco, mientras que las que están en el medio tienen una inclinación de 2,61 segundos de arco. La línea que formarían los dinteles entre columnas y que constituye la base del triángulo que corona el edificio, en realidad es un ángulo de 2,64 segundos de arco con el vértice más elevado que los extremos. De esta forma, y con otras correcciones que no se mencionan aquí, se logra que cualquier observador que se sitúe en los tres puntos principales de vista vea todo el conjunto paralelo, uniforme y recto.[14]
  • En los violines, la ubicación de las efes (los “oídos”, u orificios en la tapa) se relaciona con el número áureo.
  • El número áureo aparece en las relaciones entre altura y ancho de los objetos y personas que aparecen en las obras de Miguel Ángel, Durero y Leonardo Da Vinci, entre otros.
  • Las relaciones entre articulaciones en el hombre de Vitruvio y en otras obras de Leonardo da Vinci.
  • En las estructuras formales de las sonatas de Mozart, en la Quinta Sinfonía de Beethoven, en obras de Schubert y Debussý (estos compositores probablemente compusieron estas relaciones de manera inconsciente, basándose en equilibrios de masas sonoras).
  • En la pág. 56 de la novela de Dan Brown El código Da Vinci aparece una versión desordenada de los primeros ocho números de Fibonacci (13, 3, 2, 21, 1, 1, 8, 5), que funcionan como una pista dejada por el curador del museo del Louvre, Jacques Saunière. En las pp. 121 a 123 explica algunas de las apariciones de este número fi (1,618) en la naturaleza.
  • En el episodio “Sabotaje” de la serie de televisión NUMB3RS (primera temporada, 2005), el genio de la matemática Charlie Eppes menciona que el número fi se encuentra en la estructura de los cristales, en la espiral de las galaxias y en la concha del nautilus.
  • Arte Póvera, movimiento artístico italiano de los años 1960, muchas de cuyas obras se basan en esta sucesión.
  • En la cinta de Darren Aronofsky Pi, fe en el caos el personaje central, Max Cohen, explica la relación que hay entre los números de Fibonacci y la sección áurea, aunque denominándola incorrectamente como Theta (θ) en vez de Phi (Φ).

[editar] El número áureo en el misticismo

En la cruz latina, símbolo del catolicismo, la relación entre el palo vertical y el horizontal es el número áureo. Así mismo, el palo horizontal divide al vertical en secciones áureas. [cita requerida]

[editar] Véase también

[editar] Referencias

  1. Fernando Corbalán (2010). La proporción áurea. RBA Coleccionables S. A.. ISBN 978-84-473-6623-1. 
  2. Este número es irracional, aunque es algebraico y también constructible mediante regla y compás, y existen numerosas aproximaciones racionales con mayor o menor error. En el año 2008 se obtuvieron cien mil millones de cifras decimales correctas. (Ver: http://numbers.computation.free.fr/Constants/Miscellaneous/Records.html) Al igual que ocurre con la raíz cuadrada de dos, es posible construir un segmento idealmente exacto con regla no graduada de un solo borde y longitud indefinida y un compás de abertura variable. ¿Qué significa esto? Que ningún dibujo puede ser tan fino como para representar el concreto y real valor puntual del número áureo. Cualquier objeto construido por el hombre o formado naturalmente, aunque se tuviera la intención manifiesta de lograr una representación de ese número, llevaría consigo un error inevitable. Un segmento de recta tan pequeño como el diámetro aparente de la partícula atómica más pequeña tiene tantos puntos geométricos como toda la recta. Con todo, la construcción geométrica es idealmente exacta y por este motivo se estimó durante un tiempo considerable a la geometría como superior a la aritmética. La diferencia está en que el valor aritmético está dado como un infinito potencial y el valor geométrico como un infinito actual, generando un segmento de recta constructible.
  3. Proporción Áurea en WolframMathWorld
  4. Mario Livio (2002). The Golden Ratio. Broadway Books. ISBN 0-7679-0816-3. 
  5. Bad approximable numbers in WolframMathWorld
  6. Trabajo presentado por Mark Barr y Shooling en la revista The Field del 14 de diciembre de 1912.
  7. N. N. Vorobiov; traducción de Carlos vega (1974). Números de Fibonacci. Editorial Mir, Moscú, rústica, 112 páginas. 
  8. Matila Ghyka (1953). Estética de las Proporciones en la Naturaleza y en las Artes. Editorial Poseidón, Buenos Aires, Capítulo V: "Del Crecimiento Armonioso", páginas 118 a 144. 
  9. D'Arcy Wentworth Thompson (1917). "On Growth and Form". Cambridge University Press.  D'Arcy Wentworth Thompson (1992). "On Growth and Form". Dover edition, 1116 páginas.  D'Arcy Thompson (1980). "Sobre el Crecimiento y la Forma. Editorial Hermann Blume, Madrid. Existen ediciones de unas 300 páginas, una reciente de Cambridge.
  10. Es una paráfrasis de un pensamiento de Ruskin mencionado en la página 139 del libro citado de Matila Ghyka
  11. "Lógicamente, la tesis de la sección áurea parecería más probable, porque de ella emana una construcción rigurosa, elegante y sencilla del triángulo meridiano, mientras que en la otra hipótesis, aún suponiendo conocido con una aproximación muy grande el valor de π, la construcción sería puramente empírica y desprovista de verdadero interés geométrico" [Es notable, además, que aunque los antiguos no sabían de la trascendencia de π, estaban completamente conscientes de la carencia de exactitud de algunos intentos de cuadratura del círculo] Matila Ghyka (1953). Estética de las Proporciones en la Naturaleza y en las Artes. Editorial Poseidón, Buenos Aires, Capítulo VIII: "La Pirámide de Keops", página 222. 
  12. Jay Hambidge (1920; 1930; 1931). "Dynamic Symmetry The Greek Vase". Yale University Press, New Haven. Jay Hambidge (22/08/2007). Dynamic Symmetry The greek vase. Rough Draf Printing. ISBN 978-1-60386-037-6. 
  13. Jay Hambidge (1924). "The Parthenon and Other Greek temples, their Dynamic Symmetry". Yale University Press, New haven. Hay todavía disponibles ejemplares de esa edición, tanto nuevos como usados y a la venta a aproximadamente $ (USA) 250. 
  14. Banister; Fletcher. "A History of Architecture". B. T. Basford, Londres. 

[editar] Bibliografía

En orden cronológico:

  • Jarolimek (Viena, 1890). Der Mathematischen Schlüssel zu der Pyramide des Cheops. 
  • Kleppisch, K. (1921). Die Cheops-Pyramide: Ein Denkmal Mathematischer Erkenntnis. Múnich: Oldenburg. 
  • Ghyka, Matila (2006). El Número de Oro. I Los ritmos. II Los Ritos. Madrid: Ediciones Apóstrofe, S. L.. ISBN 978-84-455-0275-4. 

[editar] Enlaces externos

Obtenido de "http://es.wikipedia.org/wiki/N%C3%BAmero_%C3%A1ureo"

08/11/2010 14:47 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: SUCESIÓN DE FIBONACCI. La sucesión inicia con 0 y 1, y a partir de ahí cada elemento es la suma de los dos anteriores.

Sucesión de Fibonacci

De Wikipedia, la enciclopedia libre
Gráfica de la sucesión de Fibonacci hasta f10

En matemáticas, la sucesión de Fibonacci es la siguiente sucesión infinita de números naturales:

0,1,1,2,3,5,8,13,21,34,55,89,144 ldots ,

La sucesión inicia con 0 y 1, y a partir de ahí cada elemento es la suma de los dos anteriores.

A cada elemento de esta sucesión se le llama número de Fibonacci. Esta sucesión fue descrita en Europa por Leonardo de Pisa, matemático italiano del siglo XIII también conocido como Fibonacci. Tiene numerosas aplicaciones en ciencias de la computación, matemáticas y teoría de juegos. También aparece en configuraciones biológicas, como por ejemplo en las ramas de los árboles, en la disposición de las hojas en el tallo, en la flora de la alcachofa y en el arreglo de un cono.

Contenido

[ocultar]

[editar] Historia

La sucesión de Fibonacci en términos de conejos.

Antes de que Fibonacci escribiera su trabajo, la sucesión de los números de Fibonacci había sido descubierta por matemáticos indios tales como Pingala (200 a.c.), Gopala (antes de 1135) y Hemachandra (c. 1150), quienes habían investigado los patrones rítmicos que se formaban con sílabas o notas de uno o dos pulsos. El número de tales ritmos (teniendo juntos una cantidad n de pulsos) era fn + 1, que produce explícitamente los números 1, 2, 3, 5, 8, 13, 21, etc.[1]

La sucesión fue descrita por Fibonacci como la solución a un problema de la cría de conejos: "Cierto hombre tenía una pareja de conejos juntos en un lugar cerrado y uno desea saber cuántos son creados a partir de este par en un año cuando es su naturaleza parir otro par en un simple mes, y en el segundo mes los nacidos parir también".[2]

Dicho de otra forma, sirve para conocer el número de conejos (parejas de conejos) que habrá en 12 meses, si estos se reproducen continuamente y cada pareja de conejos produce una nueva pareja de conejos (un macho y una hembra). Cada conejo se puede cruzar a la edad de un mes, siendo su periodo de gestación un mes. Siendo así, se tiene que:

Número de MesExplicación de la genealogíaParejas de conejos totales
Fin del mes 00 conejos vivos.0 parejas en total.
Comienzo del mes 1Nace una pareja de conejos (pareja A).1 pareja en total.
Fin del mes 1La pareja A tiene un mes de edad. Se cruza la pareja A.1+0=1 pareja en total.
Fin del mes 2La pareja A da a luz a la pareja B. Se vuelve a cruzar la pareja A.1+1=2 parejas en total.
Fin del mes 3La pareja A da a luz a la pareja C. La pareja B cumple 1 mes. Se cruzan las parejas A y B.2+1=3 parejas en total.
Fin del mes 4Las parejas A y B dan a luz a D y E. La pareja C cumple 1 mes. Se cruzan las parejas A, B y C.3+2=5 parejas en total.
Fin del mes 5A, B y C dan a luz a F, G y H. D y E cumplen un mes. Se cruzan A, B, C, D y E.5+3=8 parejas en total.
Fin del mes 6A, B, C, D y E dan a luz a I, J, K, L y M. F, G y H cumplen un mes. Se cruzan A, B, C, D, E, F, G y H.8+5=13 parejas en total.
.........
Fin del mes 12......

Nota: al contar la cantidad de letras distintas en cada mes, se puede saber la cantidad de parejas totales que hay hasta ese mes.

De esta manera Fibonacci presentó la sucesión en su libro Liber Abaci, publicado en 1202. Muchas propiedades de la sucesión de Fibonacci fueron descubiertas por Édouard Lucas, responsable de haberla denominado como se la conoce en la actualidad.[3]

También Kepler describió los números de Fibonacci, y el matemático escocés Robert Simson descubrió en 1753 que la relación entre dos números de Fibonacci sucesivos fn + 1 / fn se acerca a la relación áurea fi (varphi) cuanto más se acerque a infinito; es más: el cociente de dos términos sucesivos de toda sucesión recurrente de orden dos tiende al mismo límite. Esta serie ha tenido popularidad en el siglo XX especialmente en el ámbito musical, en el que compositores con tanto renombre como Béla Bartók, Olivier Messiaen y Delia Derbyshire la han utilizado para la creación de acordes y de nuevas estructuras de frases musicales.

[editar] Definición formal

Chimenea con la secuencia de Fibonacci

Los números de Fibonacci f_0,f_1,f_2,f_3,dots quedan definidos por las ecuaciones

(1) f_0=0,

(2) f_1=1,

(3) f_n = f_{n-1} + f_{n-2}, para n = 2,3,4,5,ldots

Esto produce los números

  • f_0 = 0,
  • f_1 = 1,
  • f_2 = 1,
  • f_3 = 2,
  • f_4 = 3,
  • f_5 = 5,
  • f_6 = 8,
  • f_7 = 13,
  • f_8 = 21,

y así sucesivamente de manera infinita.

[editar] Representaciones alternativas

Para analizar la sucesión de Fibonacci (y, en general, cualquier sucesión) es conveniente obtener otras maneras de representarla matemáticamente.

[editar] Función generadora

Una función generadora para una sucesión cualquiera a_0,a_1,a_2,dots es la función f(x) = a_0+a_1x+a_2x^2+a_3x^3+a_4x^4+cdots, es decir, una serie de potencias donde cada coeficiente es un elemento de la sucesión. Los números de Fibonacci tienen la función generadora

(4) fleft(xright)=frac{x}{1-x-x^2}

Cuando esta función se expande en potencias de x,, los coeficientes resultan ser la sucesión de Fibonacci:

frac{x}{1-x-x^2}=0x^0+1x^1+1x^2+2x^3+3x^4+5x^5+8x^6+13x^7+cdots

[editar] Fórmula explícita

La definición de la sucesión de Fibonacci es recurrente; es decir que se necesitan calcular varios términos anteriores para poder calcular un término específico. Se puede obtener una fórmula explícita de la sucesión de Fibonacci (que no requiere calcular términos anteriores) notando que las ecuaciones (1), (2) y (3) definen la relación de recurrencia

f_{n+2}-f_{n+1}-f_n=0,

con las condiciones iniciales

f_0=0, y f_1=1,

El polinomio característico de esta relación de recurrencia es t2t − 1 = 0, y sus raíces son

t=frac{1pmsqrt 5}{2}

De esta manera, la fórmula explícita de la sucesión de Fibonacci tendrá la forma

f_n=bleft(frac{1+sqrt5}2right)^n+dleft(frac{1-sqrt5}2right)^n

Si se toman en cuenta las condiciones iniciales, entonces las constantes b y d satisfacen la ecuación anterior cuando n = 0 y n = 1, es decir que satisfacen el sistema de ecuaciones

left.begin{array}{rcl}b+d & = & 0  bleft(frac{1+sqrt5}2right)+dleft(frac{1-sqrt5}2right)&=&1end{array}right}

Al resolver este sistema de ecuaciones se obtiene

b=frac1{sqrt5},d=-frac1{sqrt5}

Por lo tanto, cada número de la sucesión de Fibonacci puede ser expresado como

(5) f_n=frac1{sqrt5}left(frac{1+sqrt5}2right)^n-frac1{sqrt5}left(frac{1-sqrt5}2right)^n

Para simplificar aún más es necesario considerar el número áureo

varphi=frac{1+sqrt5}2

de manera que la ecuación (5) se reduce a

(6) f_n=frac{varphi^n-left(-varphiright)^{-n}}{sqrt5}

Esta fórmula se le atribuye a Édouard Lucas, y es fácilmente demostrable por inducción matemática. A pesar de que la sucesión de Fibonacci consta únicamente de números naturales, su fórmula explícita incluye al número irracional varphi,. De hecho, la relación con este número es estrecha.

[editar] Forma matricial

Otra manera de obtener la sucesión de Fibonacci es considerando el sistema lineal de ecuaciones

left . begin{array}{rcl}           f_{n} &=& f_{n}  f_{n-1} + f_{n} &=& f_{n+1} end{array} right }

Este sistema se puede representar mediante su notación matricial como

begin{bmatrix}0&11&1end{bmatrix}begin{bmatrix}f_{n-1}f_{n}end{bmatrix} = begin{bmatrix}f_{n}f_{n+1}end{bmatrix}

Conociendo a f0 = 0 y f1 = 1, al aplicar la fórmula anterior n veces se obtiene

(7) begin{bmatrix}0&11&1end{bmatrix}^nbegin{bmatrix}01end{bmatrix} = begin{bmatrix}f_{n}f_{n+1}end{bmatrix}

Una vez aquí, simplemente tenemos que diagonalizar la matriz, facilitando así la operación de potenciación, y obteniendo por tanto la fórmula explícita para la sucesión que se especificó arriba.

y más aún

(8) begin{bmatrix}0&11&1end{bmatrix}^n=begin{bmatrix}f_{n-1}&f_nf_n&f_{n+1}end{bmatrix}

Estas igualdades pueden probarse mediante inducción matemática.

[editar] Propiedades de la sucesión

Al construir bloques cuya longitud de lado sean números de Fibonacci se obtiene un dibujo que asemeja al rectángulo áureo (véase Número áureo).

Los números de Fibonacci aparecen en numerosas aplicaciones de diferentes áreas. Por ejemplo, en modelos de la crianza de conejos o de plantas, al contar el número de cadenas de bits de longitud n que no tienen ceros consecutivos y en una vasta cantidad de contextos diferentes. De hecho, existe una publicación especializada llamada Fibonacci Quarterly[4] dedicada al estudio de la sucesión de Fibonacci y temas afines. Se trata de un tributo a cuán ampliamente los números de Fibonacci aparecen en matemáticas y sus aplicaciones en otras áreas. Algunas de las propiedades de esta sucesión son las siguientes:

  • La razón o cociente entre un término y el inmediatamente anterior varía continuamente, pero se estabiliza en el número áureo. Es decir:

lim_{ntoinfty}frac{f_{n+1}}{f_n}=varphi

Este límite no es privativo de la Sucesión de Fibonacci. Cualquier sucesión recurrente de orden 2, como la sucesión 3, 4, 7, 11, 18,..., lleva al mismo límite. Esto fue demostrado por Barr y Schooling en una carta publicada en la revista londinense "The Field" del 14 de diciembre de 1912. Los cocientes son oscilantes; es decir, que un cociente es menor al límite y el siguiente es mayor. Los cocientes pueden ordenarse en dos sucesiones que se aproximan asintóticamente por exceso y por defecto al valor límite.
  • Cualquier número natural se puede escribir mediante la suma de un número limitado de términos de la sucesión de Fibonacci, cada uno de ellos distinto a los demás. Por ejemplo, 17 = 13 + 3 + 1, 65 = 55 + 8 + 2.
  • Tan sólo un término de cada tres es par, uno de cada cuatro es múltiplo de 3, uno de cada cinco es múltiplo de 5, etc. Esto se puede generalizar, de forma que la sucesión de Fibonacci es periódica en las congruencias módulo m, para cualquier m.
  • La sucesión puede expresarse mediante otra fórmula explícita llamada forma de Binet (de Jacques Binet). Si textstylealpha = frac{1+sqrt 5}{2} y textstylebeta = frac{1-sqrt 5}{2}, entonces
f_n=frac{alpha^n-beta^n}{alpha-beta} y f_napproxfrac{alpha^n}{sqrt 5},
  • Cada número de Fibonacci es el promedio del término que se encuentra dos posiciones antes y el término que se encuentra una posición después. Es decir
f_n=frac{f_{n-2}+f_{n+1}}2
  • Lo anterior también puede expresarse así: calcular el siguiente número a uno dado es 2 veces éste número menos el número 2 posiciones más atrás:fn + 1 = fn * 2 − fn − 2
  • La suma de los n primeros números es igual al número que ocupa la posición n + 2 menos uno. Es decir
f_0+f_1+f_2+cdots+f_n=f_{n+2}-1
  • Otras identidades interesantes incluyen las siguientes:
f_0-f_1+f_2-cdots+(-1)^nf_n=(-1)^nf_{n-1}-1

 

f_1+f_3+f_5+cdots+f_{2n-1}=f_{2n}

 

f_0+f_2+f_4+cdots+f_{2n}=f_{2n+1}-1

 

f_0^2+f_1^2+f_2^2+cdots+f_n^2=f_nf_{n+1}

 

f_1f_2+f_2f_3+f_3f_4+cdots+f_{2n-1}f_{2n}=f_{2n}^2

 

f_1f_2+f_2f_3+f_3f_4+cdots+f_{2n}f_{2n+1}=f_{2n+1}^2-1

 

Si kgeq1, entonces f_{n+k}=f_kf_{n+1}+f_{k-1}f_n, para cualquier ngeq0

 

f_{n+1}f_{n-1}-f_n^2=(-1)^n (Identidad de Cassini)

 

f_{n+1}^2+f_n^2=f_{2n+1}

 

f_{n+2}^2-f_{n+1}^2=f_nf_{n+3}
Phi forma parte de una expresión de la sucesión de Fibonacci.

 

f_{n+2}^2-f_n^2=f_{2n+2}

 

f_{n+2}^3+f_{n+1}^3-f_n^3=f_{3n+3}

 

f_{n}=varphi ^{n+1}-(f_{n+1})varphi (con φ = número áureo)

 

mathrm{mcd}left(f_n,f_mright)=f_{mathrm{mcd}left(n,mright)}Esto significa que f_n, y f_{n+1}, son primos relativos y que f_k, divide exactamente a f_{nk},
  • Los números de Fibonacci aparecen al sumar las diagonales del triángulo de Pascal. Es decir que para cualquier ngeq0,
f_{n+1}=sum_{j=0}^{leftlfloorfrac n 2rightrfloor}begin{pmatrix}n-jjend{pmatrix}y más aúnf_{3n}=sum_{j=0}^nbegin{pmatrix}njend{pmatrix}2^jf_j
  • Si fp = a, tal que a es un número primo, entonces p también es un número primo, con una única excepción, f4 = 3; 3 es un número primo, pero 4 no lo es.
  • La suma infinita de los términos de la sucesión textstylefrac{f_n}{10^n} es exactamente textstylefrac{10}{89}.
  • La suma de diez números Fibonacci consecutivos es siempre 11 veces superior al séptimo número de la serie.
  • El último dígito de cada número se repite periódicamente cada 60 números. Los dos últimos, cada 300; a partir de ahí, se repiten cada 15times10^{n-1} números.

[editar] Generalización

Gráfica de la sucesión de Fibonacci extendida al campo de los números reales.

El concepto fundamental de la sucesión de Fibonacci es que cada elemento es la suma de los dos anteriores. En este sentido la sucesión puede expandirse al conjunto de los números enteros como ldots,-8,5,-3,2,-1,1,0,1,1,2,3,5,8,ldots de manera que la suma de cualesquiera dos números consecutivos es el inmediato siguiente. Para poder definir los índices negativos de la sucesión, se despeja f_{n-2}, de la ecuación (3) de donde se obtiene

f_{n-2}=f_n-f_{n-1},

De esta manera, f_{-n}=f_n, si n es impar y f_{-n}=-f_n, si n es par.

La sucesión se puede expandir al campo de los números reales tomando la parte real de la fórmula explícita (ecuación (6)) cuando n es cualquier número real. La función resultante

f(x)=frac{varphi^x-cos(pi x)varphi^{-x}}{sqrt 5}

tiene las mismas características que la sucesión de Fibonacci:

  • f(0)=0~
  • f(1)=1~
  • f(x)=f(x-1)+f(x-2)~ para cualquier número real x

Una sucesión de Fibonacci generalizada es una sucesión g_0,g_1,g_2,ldots donde

(9) g_n=g_{n-1}+g_{n-2}, para n=2,3,4,5,ldots

Es decir, cada elemento de una sucesión de Fibonacci generalizada es la suma de los dos anteriores, pero no necesariamente comienza en 0 y 1.

Una característica notable es que, si g_0,g_1,g_2,ldots es una sucesión de Fibonacci generalizada, entonces

g_n=f_{n-1}g_0+f_ng_1~

Por ejemplo, la ecuación (7) puede generalizarse a

begin{bmatrix}0&11&1end{bmatrix}^nbegin{bmatrix}g_0g_1end{bmatrix} = begin{bmatrix}g_{n}g_{n+1}end{bmatrix}

Esto significa que cualquier cálculo sobre una sucesión de Fibonacci generalizada se puede efectuar usando números de Fibonacci.

[editar] Sucesión de Lucas

Gráfica de la sucesión de Lucas extendida al campo de los números reales.

Un ejemplo de sucesión de Fibonacci generalizada es la sucesión de Lucas, descrita por las ecuaciones

  • l_0=2~
  • l_1=1~
  • l_n=l_{n-1}+l_{n-2}~ para n=2,3,4,5,ldots

La sucesión de Lucas tiene una gran similitud con la sucesión de Fibonacci y comparte muchas de sus características. Algunas propiedades interesantes incluyen:

  • La proporción entre un número de Lucas y su sucesor inmediato se aproxima al número áureo. Es decir
lim_{ntoinfty}frac{l_{n+1}}{l_n}=varphi
  • La fórmula explícita para la sucesión de Lucas es
l_n=varphi^n+(-varphi)^{-n}
  • La suma de los primeros n números de Lucas es el número que se encuentra en la posición n + 2 menos uno. Es decir
l_0+l_1+l_2+cdots+l_n=l_{n+2}-1
  • Cualquier fórmula que contenga un número de Lucas puede expresarse en términos de números de Fibonacci mediante la igualdad
l_n=f_{n-1}+f_{n+1}~
  • Cualquier fórmula que contenga un número de Fibonacci puede expresarse en términos de números de Lucas mediante la igualdad
f_n=frac{l_{n-1}+l_{n+1}}{5}

[editar] Algoritmos de cálculo

Calculando f7 usando el algoritmo 1.

Para calcular el n-ésimo elemento de la sucesión de Fibonacci existen varios algoritmos (métodos). La definición misma puede emplearse como uno, aquí expresado en pseudocódigo:

Algoritmo 1 Versión recursiva (Complejidad O(varphi^n),)

función {it fib}(n),

si n<2, entonces devuelve n,si no devuelve {it fib}(n-1) + {it fib}(n-2),

Usando técnicas de análisis de algoritmos es posible demostrar que, a pesar de su simplicidad, el algoritmo 1 requiere efectuar fn + 1 − 1 sumas para poder encontrar el resultado. Dado que la sucesión fn crece tan rápido como varphi^n, entonces el algoritmo está en el orden de varphi^n. Es decir, que este algoritmo es muy lento. Por ejemplo, para calcular f50 este algoritmo requiere efectuar 20365011073 sumas.

Para evitar hacer tantas cuentas, es común recurrir a una calculadora y utilizar la ecuación (6), sin embargo, dado que varphi es un número irracional, la única manera de utilizar esta fórmula es utilizando una aproximación de varphi y obteniendo en consecuencia un resultado aproximado pero incorrecto. Por ejemplo, si se usa una calculadora de 10 dígitos, entonces la fórmula anterior arroja como resultado f_{50}=1.258626903times10^{10} aun cuando el resultado correcto es f50 = 12586269025. Este error se hace cada vez más grande conforme crece n.

Un método más práctico evitaría calcular las mismas sumas más de una vez. Considerando un par (i,j), de números consecutivos de la sucesión de Fibonacci, el siguiente par de la sucesión es (j,i+j),, de esta manera se divisa un algoritmo donde sólo se requiere considerar dos números consecutivos de la sucesión de Fibonacci en cada paso. Este método es el que usaríamos normalmente para hacer el cálculo a lápiz y papel. El algoritmo se expresa en pseudocódigo como:

Algoritmo 2 Versión iterativa (Complejidad O(n),)

función {it fib}(n),

igets 1jgets 0para k, desde 1, hasta n, hacer tgets i+jigets jjgets tdevuelve j,

Esta versión requiere efectuar sólo n sumas para calcular fn, lo cual significa que este método es considerablemente más rápido que el algoritmo 1. Por ejemplo, el algoritmo 2 sólo se requiere efectuar 50 sumas para calcular f50.

Calculando f100 usando el algoritmo 3.

Un algoritmo todavía más rápido se sigue partiendo de la ecuación (8). Utilizando leyes de exponentes es posible calcular xn como

x^n=begin{cases} x & mbox{si }n=1  left(x^{frac n 2}right)^2 & mbox{si }nmbox{ es par}  xtimes x^{n-1} & mbox{si }nmbox{ es impar} end{cases}

De esta manera se divisa el algoritmo de tipo Divide y Vencerás donde sólo se requeriría hacer, aproximadamente, log2(n) multiplicaciones matriciales. Sin embargo, no es necesario almacenar los cuatro valores de cada matriz dado que cada una tiene la forma

begin{bmatrix} a & b  b & a+b end{bmatrix}

De esta manera, cada matriz queda completamente representada por los valores a y b, y su cuadrado se puede calcular como

begin{bmatrix} a & b  b & a+b end{bmatrix}^2 =  begin{bmatrix}a^2+b^2 & b(2a+b) b(2a+b) & (a+b)^2+b^2end{bmatrix}

Por lo tanto el algoritmo queda como sigue:

Algoritmo 3 Versión Divide y Vencerás (Complejidad O(log(n)),)

función {it fib}(n),

si nleq0 entonces devuelve 0,igets n-1(a,b) gets (1,0)(c,d) gets (0,1)mientras i > 0, hacer si i, es impar entonces (a,b) gets (db + ca, d(b + a) + cb)(c,d) gets (c^2 + d^2, d(2c + d))igets idiv 2devuelve a+b,

A pesar de lo engorroso que parezca, este algoritmo permite reducir enormemente el número de operaciones que se necesitan para calcular números de Fibonacci muy grandes. Por ejemplo, para calcular f100, en vez de hacer las 573147844013817084100 sumas del algoritmo 1 o las 100 sumas con el algoritmo 2, el cálculo se reduce a tan sólo 9 multiplicaciones matriciales.

[editar] La sucesión de Fibonacci en la cultura popular

Sucesión de Fibonacci in art, Martina Schettina 2008, 40 x 40 cm
  • En la pág. 61 de la novela de Dan Brown El código Da Vinci aparece una versión desordenada de los primeros ocho números de Fibonacci (13, 3, 2, 21, 1, 1, 8, 5), que funcionan como una pista dejada por el conservador del museo del Louvre, Jacques Saunière.
  • En el álbum Lateralus de la banda estadounidense Tool, los patrones de la batería (Danny Carey) de la canción "Lateralus" siguen la Sucesión de Fibonacci del número 13 (número de pistas del disco): 1,1,2,3,5,8,13,1,1,2,3,5,8,13,1,1,...
  • En la miniserie Taken, la Sucesión de Fibonacci, como la Ecuación de Dios, es descubierta en los planes de los extraterrestres, en ejemplos como que sus naves tienen 5 tripulantes, sus manos 3 dedos y un pulgar, 1597 avistamientos ovnis en año anterior, se siguieron a 55 parejas para descubrir la híbrida humano-extraterrestre Allie, y que finalmente el número de abducidos era de 46368. Incidentalmente se habla en de un hombre que fue abducido 13 veces. 1, 3, 5, 13, 55, 1597, 46368, todos números Fibonacci.
  • En el filme de Darren Aronofsky π el orden del caos el judío Rabbi Cohen presenta la teoría en hebreo transcrito en números en la cual el personaje Max Cohen relaciona esta última teoría con la secuencia de Fibonacci llegando en conclusión que todo esta basado en la ley del orden y el caos.
  • En un lateral de la cúpula de la antigua sinagoga ahora convertida en el Museo Nazionale del Cinema, más conocida como Mole Antonelliana, en Torino (Italia), se puede observar una instalación luminosa de la sucesión de números de Fibonacci.
  • El Dr. Walter Bishop de la serie de televisión Fringe usa números de la serie de Fibonacci para las contraseñas de sus cajas de seguridad.
  • En el videojuego de Assasins Creed 2, en uno de los acertijos de los glifos para resolverlo se debe usar la suceción de Fibonaccci para poder resolverlo

[editar] La sucesión de Fibonacci en la naturaleza

La gran mayoría de los árboles parecen crecer siguiendo la sucesión de fibonacci: El tronco (1) se divide en una rama grande (1), esta rama se divide en dos (2), luego, cada una de ellas se divide en 3 (3) ramas más pequeñas, y así sucesivamente.

El Sistema Solar pareciera seguir este patrón: Mercurio (1), Venus (1), La Tierra (2, incluyendo La Luna), Marte (3, incluyendo Fobos y Deimos). Hasta aquí la semejanza, pues el planeta que sigue en el Sistema Solar (Júpiter) tiene más de 60 satélites conocidos. Sin embargo, sólo 4 de ellos son observables fácilmente (Io, Europa, Ganímedes y Calisto), dado que los otros son marcadamente más pequeños. Así, podemos extender hasta el número 5 la presencia de la serie de Fibonacci en nuestro Sistema Solar.

En el cuerpo humano podemos decir que la cabeza es 1, el cuello, 1, los brazos (2), brazo, antebrazo y mano (3), luego los cinco dedos (5), es decir, la sucesión de Fibonacci hasta el 5.

Los machos de una colmena de abejas tienen un árbol genealógico que cumple con esta sucesión. El hecho es que los zánganos, el macho de la abeja, no tiene padre (1), pero sí que tiene una madre (1, 1), dos abuelos, que son los padres de la reina (1, 1, 2), tres bisabuelos, ya que el padre de la reina no tiene padre (1, 1, 2, 3), cinco tatarabuelos (1, 1, 2, 3, 5), ocho tataratatarabuelos (1, 1, 2, 3, 5, 8) y así sucesivamente, cumpliendo con la sucesión de Fibonacci.

[editar] Véase también

[editar] Referencias

  1. Knuth, 1997, pág. 80
  2. Laurence Sigler, Fibonacci's Liber Abaci, página 404
  3. Handbook of discrete and combinatorial mathematics, sección 3.1.2
  4. Fibonacci Quarterly

[editar] Bibiliografía

  • Kolman, Bernard; Hill, David R. (2006). Álgebra Lineal. México: PEARSON EDUCACIÓN. ISBN 970-26-0696-9. 
  • Johnsonbaugh, Richard (2005). Matemáticas Discretas. México: PEARSON EDUCACIÓN. ISBN 970-26-0637-3. 
  • Brassard, G; Bratley, P. (1997). Fundamentos de Algoritmia. Madrid: PRETINCE HALL. ISBN 84-89660-00-X. 
  • Kenneth, H. Rosen (2003). Discrete mathematics and its applications. McGraw Hill. ISBN 0-07-123374-1. 
  • Kenneth H. Rosen; John G. Michaels (1999). Handbook of discrete and combinatorial mathematics. CRC. ISBN 0-8493-0149-1. 
  • N. N. Vorobiov (1974). Números de Fibonacci. Editorial Mir, Moscú, Colección Lecciones Populares de Matemáticas. Traducción al español de Carlos Vega, catedrático de Matemáticas Superiores y candidato a doctor en ciencias físico-matemáticas. 
  • A. I. Markushevich (1974; 1981). Sucesiones recurrentes. Editorial Mir, Moscú, Colección Lecciones Populares de Matemáticas. Traducción al español de Carlos Vega. 
  • Luca Pacioli (1946). La Divina Proporción. Editorial Losada, Buenos Aires. 

[editar] Enlaces externos

08/11/2010 14:35 petalofucsia #. Matemáticas No hay comentarios. Comentar.

¿Y esta publicidad? Puedes eliminarla si quieres

MATEMÁTICAS: SECUENCIA MATEMÁTICA. Una secuencia es una concatenación de símbolos obtenidos a partir de una sucesión. Son semejantes a las sucesiones y se pueden derivar fácilmente de éstas.

Secuencia (matemáticas)

De Wikipedia, la enciclopedia libre

Una secuencia es una concatenación de símbolos obtenidos a partir de una sucesión. Son semejantes a las sucesiones y se pueden derivar fácilmente de éstas.

[editar] Definición

Sea un alfabeto A = {a0,a1,...ak}. Una secuencia de longitud l es una cadena de símbolos de A dada por

s = {s0,s1,...sl}

donde

 begin{matrix} s_n:& mathbb{N} & to & A     & n          & to & a_i end{matrix}

[editar] Ejemplos

Como se indicaba antes, la forma más sencilla de derivar secuencias es a partir de sucesiones. Por ejemplo, basándonos en la sucesión de Fibonacci es relativamente sencillo definir una secuencia para el alfabeto A = {0,1} según el siguiente método:

   s(n)= left{    begin{matrix}     1 & mbox{si n esta en la sucesion de Fibonacci}      0 & mbox{en otro caso}    end{matrix}   right.

Que obtendría la siguiente secuencia de dígitos binarios:

1110100100001000000010000000000001...

Algunas secuencias, como la derivada de la sucesión de Thue-Morse (también definida para un alfabeto binario) han sido estudiadas y aplicadas en diferentes ámbitos tales como el ajedrez, la generación de música fractal por autosimilaridad o la codificación de señales (por ejemplo los códigos Gray).

[editar] Véase también

08/11/2010 14:25 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿EL ORÍGEN, NO PODRÍA ESTAR EN UNA SUCESIÓN O UNA SECUENCIA?. En terminología matemática se incluye sucesión para designar la existencia de elementos encadenados o sucesivos.

Sucesión matemática

De Wikipedia, la enciclopedia libre

En terminología matemática se incluye sucesión para designar la existencia de elementos encadenados o sucesivos.

Se excluye totalmente la sinonimia con el término serie.

En textos académicos se suele llamar simplemente sucesión con el bien entendido que todas son del mismo tipo. Esto no impide la existencia de sucesiones de diversas entidades matemáticas.

Cuando abundan sucesiones de todo tipo se puede cambiar incluso el nombre de sucesión por otro.

Véase secuencia, tupla, colección, familia y conjuntos en matemáticas.

Contenido

[ocultar]

[editar] Definiciones

Las diferentes definiciones suelen estar ligadas al área de trabajo, la más común y poco general es la definición de sucesión numérica, en la práctica se usan sucesiones de forma intuitiva:

[editar] Definición abstracta

Clase de finitos o numerables objetos ordenados.

[editar] Definición conjuntista

Una sucesión en un conjunto X es una enumeración de elementos de X, es decir una aplicación de mathbb{N} en X.

[editar] Notación

Notaremos por left{{x_n}right}_{nepsilonmathbb{N}} a una sucesión, donde x la identifica como distinta de otra digamos left{{y_n}right}_{nepsilonmathbb{N}}.

La notación es permisiva en cuanto a su modificación si realmente es necesario.

[editar] Definición de término general

Llamaremos término general de una sucesión a x_n^{},donde {nepsilonmathbb{N}} indica el lugar que ocupa en dicha sucesión.

[editar] Definición de parcial

Llamaremos parcial de left{{x_n}right}_{nepsilonmathbb{N}} a una sucesión left{{x_{n_i}}right}_{n_iepsilonmathbb{N}} donde n_i^{}<n_{i+1}^{}

[editar] Ejemplos en distintas áreas

Estos ejemplos pretenden ser una pequeña muestra de la infinidad, propiamente dicha, de usos que tienen dichas sucesiones en matemáticas.

El trabajo interno en el desarrollo de cada tema en cada área obliga a diversificar el modo de nominar y notar las sucesiones, haciéndose frecuente el uso de índices, subíndices y superíndices para salvar la sobrecarga de notación y hacerlas más legibles y estéticas en cuanto a la presentación.

[editar] En mathbb{C}^n

Se puede tener una sucesión left{{V^{(i)}}right}_{iepsilonmathbb{N}} tal que  {V^{(i)}} {:=(a_1^{(i)},...,a_n^{(i)}),donde; a_j^{(i)}}in mathbb{C}

[editar] En el espacio de las sucesiones finitas en mathbb{C}

Se puede tener una sucesión left{ {a^{(i)}}right}_{iepsilonmathbb{N}} tal que  {a^{(i)}} {:=(a_1^{(i)},...,a_{n_i}^{(i)} ,0,...),donde; a_j^{(i)}}in mathbb{C}-left{0right}

[editar] En K[x]

Un polinómio P(x) in K[x] no es más que una sucesión finita left{{a_n}right}_n tal que a_n in K representada como P(x)_{}^{}=a_0+a_1x+a_2x^2+...+a_nx^n.

[editar] En  M_{m times n}(k)

Se puede tener una sucesión left{{A_i}right}_{i in mathbb{N}} tal que A_i:= begin{pmatrix} a_{1,1}^{(i)} & ldots & a_{1,n}^{(i)}  vdots && vdots  a_{m,1}^{(i)} & ldots & a_{m,n}^{(i)} end{pmatrix}, donde a_{j,k}^{(i)} in K.

[editar] En un espacio vectorial topológico

Se puede tener una sucesión left{{V_{i}^{}}right}_{iepsilonmathbb{N}}, donde  V_n^{}:= alpha_n B, donde  alpha_n in mathbb{R} es una sucesión real arbitraria y B un abierto.

[editar] Sucesiones funcionales

Se puede tener una sucesión de funciones continuas left{{{f(x)}_n}right}_{nepsilonmathbb{N}}=sin(x)^n.

[editar] En el lenguaje proposicional

Sea A_{}^{} un alfabeto, llamaremos A_{}^n al conjunto de sucesiones finitas de n elementos de A, se define inductivamente por la sucesión de productos cartesianos siguiente: A^1=A, A^2=Atimes A, ... , A^n:=A^{n-1}times A

  • así {<}a_1,...,a_n>:={<<}a_1,...,a_{n-1}{>},a_n{>}in A^n {,y;} a_i:={<}a_i{>}in A.

[editar] En homología simplicial

El complejo de cadenas simplicial del complejo simplicial K, no es más que una determinada sucesión de grupos abelianos y morfismos

[editar] En el lenguaje de las categorías

Sea  mathcal{A} una categoría, podemos tener una sucesión left{{A_n}right}_{n in mathbb{N}}, donde A_{n}^{} in Ob({ mathcal{A} }).

[editar] Sucesiones numéricas

Una sucesión numérica se formaliza como una aplicación de los naturales en los reales, es decir :

 begin{matrix} u:& mathbb{N} & to & mathbb{R}  & n & to & u_n end{matrix}

que escribiremos simplemente como left{{u_n}right}_{n in mathbb{N}} o, si se da por entendido que los subíndices son enteros, también vale left{{u_n}right}_{n geq 0}.

El nombre que recibe la sucesión también puede hacer referencia a los valores que toma sobre los reales, así, si la imagen de u_{}^{} fuesen los racionales, es decir fracciones enteras del tipo frac{a}{b}, ; b neq 0, podemos llamarla sucesión de números racionales, y lo mismo para los irracionales, naturales, enteros, algebraicos, trascendentes, ... .

[editar] Notas y ejemplos básicos

Para definir término a término la sucesión, se indica para cada termino el valor que le corresponde directamente:

  • El primero es u_0^{}= a por ejemplo 3,
  • el segundo es u_1^{}= a por ejemplo -10,
  • el tercero es u_2^{}= a por ejemplo 9, y así sucesivamente.
  • Para indicar, si hace falta, el comportamiento del resto de los valores, se usa el término general y se escribe acompañado como , ; ... ; ,u_n^{}= a por ejemplo número al azar, ... .
Los puntos suspensivos dan por entendido que los valores de la sucesión se omiten ya que estos quedan claramente determinados hasta el infinito, siendo el n-ésimo valor, u_n^{}=, el portador del método para generar el valor de cada término, y el nombre n_{}^{} puede ser cambiado, si hace falta, por i_{}^{}, j_{}^{}, k_{}^{}, l_{}^{}, ... .

Materialmente seria: 3, -10, 9, 7, ... , número al azar, ... .

[editar] Sucesión finita

Diremos que una sucesión es finita si determinamos su último termino, por ejemplo el n-ésimo:

Genéricamente:  a_0, ; a_1, ; a_2, ; ... ; , ; a_i , ; ... ; , ; a_n , donde a_i^{} sería el término general si hiciese falta.ejemplo: 100, 99, 98, ... , 1, 0.

[editar] Sucesión constante

Diremos que una sucesión es constante si todos los términos valen a_{}^{}, un número real cualquiera, ejemplo:

Genéricamente u_0^{} = a, ; u_1 = a, ; u_2 = a, ; u_3 = a, ; ... ; , ; u_i = a,;... .ejemplo: si a_{}^{}=1 queda como 1, 1, 1, 1, ... ,1 ,... , es decir, que todos los valores son el mismo, 1.

[editar] Sucesión creciente

Si imponemos al termino general, de una sucesión numérica, la condición que a_i^{} < a_{i+1}, es decir, que el siguiente término,  a_{i+1}^{}, siempre sea mayor estricto que su predecesor, a_i^{}, se llaman sucesiones estrictamente crecientes:

Para naturales: 1, 2, 3, 4, 5, 6, ... .Para enteros: -10, -9, -8, -7, -6, ... .Para reales: -2'01, ; -1, ; 0, ; sqrt{2}, ; e_{}^{}, ; pi, ; ,;....

Si imponemos a_i^{} leq a_{i+1}, es decir, una desigualdad no estricta, entonces se pueden incluir, entre otras, las sucesiones constantes.

[editar] Sucesión decreciente

Al igual que las crecientes tenemos, según el termino general, que:

  • si a_i^{} geq a_{i+1} entonces la sucesión es decreciente,
  • si a_i^{} > a_{i+1} es estrictamente decreciente.

[editar] Sucesión alternada

Intuitivamente se llama sucesión alternada cuando alterna valores de signo opuesto, como an = ( − 1)n que nos genera la sucesión: 1, -1, 1, -1, 1, -1, ... . Utilizado por las series llamadas series alternas.

[editar] Según el término general

El termino general de la sucesión queda definido de forma explícita si su valor está en función del valor del subíndice, es decir, si  u_i^{} = f(i) donde  f: mathbb{N} to mathbb{R} es una función cualquiera como por ejemplos:

 u_i^{} = i + 1 que daría la sucesión de naturales sucesivos, es decir, 1, 2, 3, 4, 5, ... . u_i^{} =2 i que daría todos los número pares incluido el cero, es decir, 0, 2, 4, 6, 8, ... . u_i^{} = i^2 que daría la sucesión de cuadrados siguiente, 0, 1, 4, 9, 16, ... .

Dada una función  f: mathbb{N} to mathbb{R} , llamaremos extensión en los reales de f_{}^{} a una función  P: mathbb{R} to mathbb{R} cuyos valores coinciden en el dominio de f_{}^{}, es decir, f_{ | mathbb{N}}=P_{ | mathbb{N}}.

  • Error fatal es nombrar a la extensión en los reales con el mismo nombre ¡ f: mathbb{R} to mathbb{R} !, pues, se trata de una asociación totalmente arbitraria y no univoca que trae confusión y no tiene sentido para algunas funciones definidas a trozos. Compruébese que  f(i)=u_i^{}=f(i)+sin(i pi) solo si la sucesión que determinan sobre los enteros es la misma, pero ¡no son la misma función!, llamemos a la extendida por ejemplo  P_{}^{}, ; Q_{}^{}, ; phi_{}^{} o  psi_{}^{} si es un polinomio, o g_{}^{} o h_{}^{} si son funciones trigonométricas, agregando subíndices si hace falta.

Perturbación.GIF

La función f puede adquirir propiedades de la extendida P, si existe P con dichas propiedades, como límites al infinito, monotonía, acotaciones... .

Casos en los que f no puede extenderse sobre los reales:

  • si definimos un como el número de factores propios de n.

El término general de la sucesión queda definido de forma implícita si su valor depende de sus predecesores, esto se indica en general del modo siguiente:

Dados previamente los valores de u_0, ; u_1,; ... ; ,; u_n, podemos definir el término general de forma inductiva como u_{i+1} = f(u_{i-n}, ; ... ; , u_i) , ; i >= n como por ejemplo con la ecuación en diferencias u_{i+1} = a_0 u_{i-n} + ; ... ; + a_n u_i  + b_n , ; i >= n, ; a_0, ; ... ; , ; a_n, ; b_n in mathbb{R} .

[editar] Ejemplos

[editar] Véase también

[editar] Enlaces externos

 


El contenido de este artículo incorpora material de una entrada de la Enciclopedia Libre Universal, publicada en castellano bajo la licencia GFDL.


08/11/2010 14:23 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: TOPOLOGÍA. La Topología es el estudio de aquellas propiedades de los cuerpos geométricos que permanecen inalteradas por transformaciones continuas.[1] Es una disciplina matemática que estudia las propiedades de los espacios topológicos y las funciones continuas. La Topología se interesa por conceptos como proximidad, número de agujeros, el tipo de consistencia (o textura) que presenta un objeto, comparar objetos y clasificar, entre otros múltiples atributos donde destacan conectividad, compacidad, metricidad o metrizabilidad, etcétera.

Topología

De Wikipedia, la enciclopedia libre
Para otros usos de este término, véase Topología (desambiguación).
 

La Topología es el estudio de aquellas propiedades de los cuerpos geométricos que permanecen inalteradas por transformaciones continuas.[1] Es una disciplina matemática que estudia las propiedades de los espacios topológicos y las funciones continuas. La Topología se interesa por conceptos como proximidad, número de agujeros, el tipo de consistencia (o textura) que presenta un objeto, comparar objetos y clasificar, entre otros múltiples atributos donde destacan conectividad, compacidad, metricidad o metrizabilidad, etcétera.

Los matemáticos usan la palabra topología con dos sentidos: informalmente es el sentido arriba especificado, y de manera formal se refieren a una cierta familia de subconjuntos de un conjunto dado, familia que cumple unas reglas sobre la unión y la intersección. Este segundo sentido puede verse desarrollado en el artículo espacio topológico.

Contenido

[ocultar]

[editar] Idea intuitiva

Particularmente se presenta la Topología como la "Geometría de la página de chicle". Esto hace referencia a que en la Geometría euclídea dos objetos serán equivalentes mientras podamos transformar uno en otro mediante isometrías (rotaciones, traslaciones, reflexiones, etc), es decir, mediante transformaciones que conservan las medidas de ángulo, longitud, área, volumen y otras. En Topología, dos objetos son equivalentes en un sentido mucho más amplio. Han de tener el mismo número de trozos, de huecos, de intersecciones, etc. En topología está permitido doblar, estirar, encoger, retorcer, etc., los objetos pero siempre que se haga sin romper ni separar lo que estaba unido, ni pegar lo que estaba separado. Por ejemplo, un triángulo es topológicamente lo mismo que una circunferencia, ya que podemos transformar uno en otra de forma continua, sin romper ni pegar. Pero una circunferencia no es lo mismo que un segmento, ya que habría que partirla por algún punto.
Ésta es la razón de que se la llame la "Geometría de la página de goma", porque es como si estuviéramos estudiando Geometría sobre un papel de goma que pudiera contraerse, estirarse, etc.

Una taza transformándose en una rosquilla (toro).

Un chiste habitual entre los topólogos (los matemáticos que se dedican a la topología) es que «un topólogo es una persona incapaz de distinguir una taza de una rosquilla». Pero esta visión, aunque muy intuitiva e ingeniosa, es sesgada y parcial. Por un lado puede llevar a pensar que la Topología trata sólo de objetos y conceptos geométricos (siendo más bien al contrario, es la Geometría la que trata con un cierto tipo de objetos topológicos). Por otro lado, en muchos casos es imposible dar una imagen o interpretación intuitiva de problemas topológicos, o incluso de algunos conceptos. El intentar visualizar los conceptos es un error frecuente entre los principiantes en la Topología, que les hace avanzar muy lentamente cuando no pueden encontrar un ejemplo gráfico, tener una visión parcial de algunos conceptos, e incluso incurrir en errores. Es frecuente entre los estudiantes primerizos escuchar que "no entienden la Topología" y que no les gusta esa rama, y generalmente se debe a que se mantienen en esta actitud gráfica. Por último, la Topología se nutre también en buena medida de conceptos cuya inspiración se encuentra en el Análisis matemático. Se puede decir que casi la totalidad de los conceptos e ideas de esta rama son conceptos e ideas topológicos.

Homeo tasse.png

 

[editar] Un ejemplo clarificador

Plano del metro de Madrid.

Observemos un antiguo plano del metro de Madrid. En él están representadas las estaciones y las líneas de metro que las unen, pero no es geométricamente exacto. La curvatura de las líneas de metro no coincide, ni su longitud a escala, ni la posición relativa de las estaciones... Pero aun así es un plano perfectamente útil. Sin embargo, este plano es exacto en cierto sentido; representa fielmente cierto tipo de información, la única que necesitamos para decidir nuestro camino por la red de metro: información topológica.

[editar] Historia de la Topología

Históricamente, las primeras ideas topológicas conciernen al concepto de límite y al de completitud de un espacio métrico, y se manifestaron principalmente en la crisis de los inconmesurables de los pitagóricos, ante la aparición de números reales no racionales. El primer acercamiento concreto al concepto de límite y también al de integral aparece en el método de exhaución de Arquímedes. La aparición del Análisis Matemático en el siglo XVII puso en evidencia la necesidad de formalizar el concepto de proximidad y continuidad, y la incapacidad de la Geometría para tratar este tema. Fue precisamente la fundamentación del Cálculo Infinitesimal, así como los intentos de formalizar el concepto de variedad en Geometría lo que llevó a la aparición de la Topología, a finales del siglo XIX y principios del XX.

Se suele fechar el origen de la Topología con la resolución por parte de Euler del problema de los puentes de Königsberg, en 1735. Ciertamente, la resolución de Euler del problema utiliza una forma de pensar totalmente topológica, y la solución del problema nos lleva a la característica de Euler, el primer invariante de la Topología Algebraica, pero sería muy arriesgado y arbitrario fechar en ese momento la aparición de la Topología. La situación es exactamente análoga a la del cálculo del área de la elipse por Arquímedes.

El término topología fue usado por primera vez por J. B. Listing, en 1836 en una carta a su antiguo profesor de la escuela primaria, Müller, y posteriormente en su libro Vorstudien zur Topologie (Estudios previos a la topología), publicado en 1847. Anteriormente se la denominaba analysis situs. Maurice Fréchet introdujo el concepto de espacio métrico en 1906.

[editar] Algo de desarrollo formal

En el artículo Glosario de topología se encuentra una colección de términos topológicos con su significado. Aquí y ahora nos limitaremos a dar algunas nociones básicas.

Como hemos dicho, el concepto fundamental de la Topología es la "relación de proximidad", que puede parecer ambigua y subjetiva. El gran logro de la Topología es dar una formulación precisa, objetiva y útil de este concepto. Para ello tomamos un conjunto de referencia X, que será el ambiente en el que nos moveremos, y al que llamaremos espacio. Tomaremos un elemento cualquiera x de X. A los elementos del espacio se les llama puntos, así que x será llamado punto, independientemente de que x sea una función, un vector, un conjunto, un ideal maximal en un anillo conmutativo y unitario... Un subconjunto V de X será un entorno de x si x es elemento de V y existe un conjunto abierto G de manera que G esté incluido en V. ¿Qué entenderemos por conjunto abierto? Aquí está el quid de la cuestión: una colección T de subconjuntos de X se dirá que es una topología sobre X si X es uno de los elementos de esa colección, si varnothing es un elemento de la colección, si la unión de elementos de la colección da como resultado un elemento de la colección y si la intersección finita de elementos de la colección también es un elemento de la colección. A los elementos de la colección T se les denomina abiertos de la topología T, y al par (X,T) se le denomina espacio topológico.

Las condiciones para que T sea topología sobre X son entonces estas:

(1) quad varnothing in T, X in T
(2) quad (O_1 in T, O_2 in T) Rightarrow (O_1 cap O_2 in T)
(3) quad forall S subset T, cup_{Oin S} O in T

Puede parecer extraño que de una definición tan altamente formal y conjuntista se obtenga una formulación precisa del concepto de proximidad. Lo primero que se observa es que sobre un mismo espacio X se pueden definir distintas topologías, generando entonces distintos espacios topológicos. Por otra parte, precisamente la manera en que quede determinada una topología sobre un conjunto (es decir, la elección del criterio que nos permita decidir si un conjunto dado es o no abierto) es lo que va a dar carácter "visualizable" o no a ese espacio topológico.

Una de las maneras más sencillas de determinar una topología es mediante una distancia o métrica, método que sólo es aplicable en algunos casos (si bien es cierto que muchos de los casos más intersantes de topologías en la Geometría y del Análisis Matemático pueden determinarse mediante alguna distancia). Una distancia sobre un conjunto X es una aplicación d: X times X longrightarrow mathbb{R} que verifica las siguientes propiedades:

d(x,y) geq 0 ;d(x,y) = d(y,x) ,d(x,y) = 0 , si y sólo si x =y , ;d(x,y) leq d(x,z) + d(z,y)

cualesquiera que sean x,y,z in X.

Si tenemos definida una distancia sobre X, diremos que la pareja

(X,d) ,

es un espacio métrico. Dado un espacio métrico (X,d), queda determinada una topología sobre X en la que los conjuntos abiertos son los subconjuntos G de X tales que cualquiera que sea el punto x de G existe un número ε > 0 de tal manera que el conjunto {y in X: d(x,y)< epsilon } está totalmente incluido en G. Al conjunto {y in X: d(x,y)< epsilon } se le denomina bola abierta de centro x y radio ε, y será precisamente un entorno del punto x.

Como se ha apuntado antes, por desgracia no toda topología proviene de una distancia, es decir, existen espacios topológicos que no son espacios métricos. Cuando un espacio topológico es además espacio métrico (esto es, cuando dada una topología sobre un conjunto, puede definirse en ese conjunto una distancia de manera que la topología generada por la distancia coincida con la topología dada) se dice que el espacio topológico es metrizable. Un problema clásico en Topología es el de determinar qué condiciones debe satisfacer un espacio topológico para que sea metrizable.

[editar] Ramas de la Topología

Se suelen considerar principalmente tres ramas:

Además de estas tres ramas, que podríamos decir propiamente topológicas, la implicación en mayor o menor medida en otras disciplinas matemáticas hacen que muchos consideren parte de la Topología al Análisis Funcional, la Teoría de la Medida, la Teoría de Nudos (parte de la Topología de dimensiones baja), la Teoría de Grupos Topológicos, etc. Es fundamental su contribución a la Teoría de Grafos, Análisis Matemático, Ecuaciones Diferenciales, Ecuaciones Funcionales, Variable Compleja, Geometría Diferencial, Geometría Algebraica, Álgebra Conmutativa, Estadística, Teoría del Caos, Geometría Fractal... Incluso tiene aplicaciones directas en Biología, Sociología, etc.

[editar] Topología General o Conjuntista

Constituye la base de los estudios en Topología. En ella se desarrollan tópicos como lo que es un espacio topológico o los entornos de un punto.

[editar] Conceptos fundamentales referidos a la topología de un conjunto

[editar] Topología, espacio topológico, abiertos, cerrados, subespacios

Sea X un conjunto cualquiera y P(X) el conjunto de sus partes. Una topología sobre X es un conjunto T subset P(X) que cumpla que X in T, varnothing in T, si A, B in T entonces A cap  B in T, y que si S subset T entonces cup_{G in S} G in T. A los elementos de T se les denomina conjuntos abiertos. Al par (X,T) se le denomina espacio topológico. A los elementos de X se les suele denominar puntos.

Nótese que desde un primer momento hemos especificado que el conjunto X es cualquiera, no necesariamente un conjunto de naturaleza geométrica. La denominación de espacio (topológico) y de punto se mantiene aun cuando X sea un conjunto de números, de funciones, de ecuaciones diferenciales, de figuras geométricas, de vectores, de conjuntos...

Como puede observarse, la definición es muy formal y general, y lo primero que se observa es que sobre un mismo conjunto pueden darse multitud de topologías distintas. Así es. Pero de momento, los conceptos de conjunto abierto en mathbb{R} o en mathbb{R}^2 o mathbb{R}^3 cumplen las condiciones exigibles a una topología. Es precisamente el comprobar que otras familias de conjuntos en otros conjuntos de naturaleza no geométrica que comparten estas mismas propiedades (como en el conjunto de soluciones de una ecuación diferencial, o el conjunto de los ceros de los polinomios con coeficientes en los ideales en un anillo conmutativo, por ejemplo) lo que motiva esta definición. Así podremos aplicar a estos conjuntos las mismas (o parecidas) técnicas topológicas que aplicamos a los abiertos del plano, por ejemplo. La situación es análoga a la que se da en Álgebra Lineal cuando se pasa de trabajar en mathbb{R}^2 o mathbb{R}^3 a trabajar en espacios vectoriales arbitrarios.

En lo que sigue, (X,T) representará siempre un espacio topológico.

Ligado al concepto de conjunto abierto está el de conjunto cerrado. Un conjunto F subset X se dice que es cerrado si su complementario X setminus F es un conjunto abierto. Es importante observar que un conjunto que no es abierto no necesariamente ha de ser cerrado, y un conjunto que no sea cerrado no necesariamente ha de ser abierto. Así, existen conjuntos que son abiertos y cerrados a la vez, como varnothing, y pueden existir conjuntos que no sean ni abiertos ni cerrados.

Es inmediato comprobar que la intersección de cerrados es un conjunto cerrado, que la unión de una cantidad finita de conjuntos cerrados es un conjunto cerrado, y que tanto X como varnothing son conjuntos cerrados.

Si Z subset X, el conjunto T_Z := { G cap Z : G in T } es una topología para Z. Se dirá entonces que el espacio (Z,TZ) es subespacio topológico del (X,T).

La noción de subespacio topológico se presenta de manera natural, y es el concepto análogo al de subgrupo en Teoría de Grupos o al de subespacio vectorial en Álgebra Lineal.

Una propiedad relativa a espacios topológicos se dice que es hereditaria cuando si un espacio la tiene, entonces también la tiene cualquiera de sus subespacios.

[editar] Base de una topología, entornos, bases locales, axiomas de numerabilidad

Una familia mathcal(B) subset T se dice que es base (de la topología T) si para cualquiera que sea el G in T existe un conjunto M subset mathcal(B) de manera que G = cup_{B in M} B.

No siempre es cómodo trabajar con una topología. A veces resulta más complicado establecer una topología que una base de topología (como en espacios métricos). En cualquier caso, una base es una manera muy cómoda de establecer una topología. Aún más sencillo es establecer una subbase, que es una familia de conjuntos para la que el conjunto de sus intersecciones finitas forma una base de topología. Uno de los casos más importantes de topología, la de los espacios métricos, viene dado por una base, la del conjunto de bolas abiertas del espacio.

Un espacio topológico se dice que cumple el Segundo Axioma de Numerabilidad (IIAN) si existe alguna base de su topología que tenga cardinalidad numerable.

Sea A subset X un conjunto cualquiera y sea x in A un punto arbitrario. Se dice que A es entorno de x si existe un conjunto abierto G de manera que x in G subset A. Todo conjunto abierto es entorno de todos sus puntos. Al conjunto de todos los entornos de un punto x se le denomina sistema de entornos de x.

Obsérvese que no se ha exigido que un entorno sea un conjunto abierto. Los entornos abiertos son un tipo de entornos muy útiles (sobre todo en Geometría y Análisis) y muy usados, tanto que en muchas ocasiones se omite el calificativo abierto. Esto es un abuso de lenguaje y debe evitarse.

Una colección mathcal(V) de entornos de un mismo punto x se dice que es una base de entornos (o base local) de x si dado cualquier entorno V de x existe un B in mathcal(V) de manera que B subset V.

Se dice que un espacio topológico cumple el Primer Axioma de Numerabilidad (IAN) si cada punto del espacio tiene alguna base local de cardinal numerable.

[editar] Subconjuntos notables asociados a un conjunto

Ahora podemos establecer una serie de definiciones de gran importancia, pues serán las piezas básicas del estudio de la topología y constituirán la materia prima de los conceptos posteriores.

[editar] Interior, exterior, frontera

Un punto x in X se dirá que es un punto interior de A si A es entorno de x. Así, el conjunto de los puntos interiores a A es un conjunto abierto, denominado Interior de A, denotado por Int (A) o también como A^{circ}. Es el mayor conjunto abierto incluido en A.

Un punto y in X se dirá que es un punto exterior a A si X setminus A es entorno de y. Así mismo, el conjunto de los puntos exteriores a A es otro conjunto abierto, denominado Exterior de A y denotado por Ext (A).

Un punto z in X se dice que es un punto frontera de A si todo entorno V de z es tal que V cap A neq varnothing y V cap (X setminus A) neq varnothing. Al conjunto de los punto frontera de A se le denomina Frontera de A y se denota por Fr(A). En otras palabras, todo entorno con centro en z tendrá elementos pertenecientes al conjunto A y otros elementos fuera del conjunto A. La frontera de A es un conjunto cerrado.

[editar] Adherencia, acumulación, puntos aislados

Un punto x in X se dice que es un punto de adherencia de A si todo entorno V de x es tal que A cap V neq varnothing. Se hace pues evidente que todo punto interior y todo punto frontera es punto de adherencia. Al conjunto de los puntos de adherencia del conjunto A se le denomina adherencia o clausura de A, y se denota por Cl(A) o por bar{A}. La clausura de un conjunto A es un conjunto cerrado, y es el menor conjunto cerrado que contiene al conjunto.

Un punto x in X se dice que es un punto de acumulación de A si todo entorno V de x es tal que (V setminus { x }) cap A neq varnothing . Al conjunto de los puntos de acumulación de un conjunto se le denomina acumulación del conjunto, o conjunto derivado, y se le denota por Ad o por A'.

Un punto x in X se dice que es un punto de Ω-acumulación de A si todo entorno V de x es tal que (V setminus { x }) cap A es un conjunto infinito. Al conjunto de los puntos de Ω-acumulación de un conjunto se le denomina Ω-acumulación del conjunto, o conjunto Ω-derivado, y se le denota por A_{Omega}^d o por A'Ω. Todo punto de Ω-acumulación es punto de acumulación, y todo punto de acumulación es punto de adherencia del mismo conjunto.

Un punto x in X se dice que es un punto aislado de A si existe algún entorno perforado V de x (es decir, un conjunto V subset X de manera que V cup {x} es un entorno de x) de manera que V cap A = varnothing. Al conjunto de los puntos aislados de A se le denomina conjunto de los puntos aislados de A, y se le denota por Aa. Todo punto aislado es punto frontera y también es punto de adherencia del mismo conjunto.

En Topología son de una importancia capital los conjuntos interior y clausura de un conjunto. Su importancia radica en ser, respectivamente, el mayor abierto contenido en el conjunto y el menor cerrado que contiene al conjunto. El interior puede obtenerse también como la unión de todos los abiertos contenidos en el conjunto, y la clausura como la intersección de todos los cerrados que contienen al conjunto. Sin tanta importancia en Topología pero de mucha en otras áreas de la Matemática son los conjuntos de acumulación, frontera y de los puntos aislados de un conjunto.

[editar] Conceptos fundamentales referidos a aplicaciones continuas y convergencia

[editar] Convergencia

La idea de la convergencia es la de "aproximar" un objeto por otro, es decir, sustituir un objeto por otro que está próximo a él. Evidentemente, al hacerlo así se está cometiendo un error, error que en general dependerá de lo próximo que se encuentre el objeto sustituido del objeto sustituto. Para hacer esta sustitución de una manera sistemática, de forma que el error pueda ser elegido arbitrariamente pequeño, aparecen distintos tipos de conjuntos. Se obtiene así un proceso de sucesivas aproximaciones que, si todo va bien, terminarían llevándonos al objeto, aunque fuese después de un número infinito de aproximaciones. El más sencillo de estos conjuntos es una sucesión, es decir, una colección infinita (numerable) y ordenada de objetos, aunque con el mismo carácter de orden hay otros conjuntos que reflejan mejor el concepto de convergencia.

Es importante observar que la Topología no trabaja con errores ni con aproximaciones. Eso entra en el ámbito del Análisis Numérico e incluso del Análisis Matemático. La Topología lo que hace en este problema es aportar las herramientas básicas y los conceptos teóricos para afrontar correctamente el problema, siempre desde un punto de vista conceptual y cualitativo. Estudia qué es lo que debe entenderse cuando decimos que un conjunto (como puede ser una sucesión) se acerca a un objeto (que puede ser un punto, un conjunto, etcétera).

[editar] Convergencia de sucesiones

Una sucesión es una aplicación en un conjunto cuyo dominio es el conjunto de los números naturales. En particular, una sucesión en un espacio topológico (X,T) , es una aplicación (x_n)_{n in mathbb{N}}: mathbb{N} longrightarrow X.

Una sucesión es el caso más sencillo de aplicación de dominio infinito.

Se dice que x in X es un punto límite de la sucesión (x_n)_{n in mathbb{N}}, o bien que (x_n)_{n in mathbb{N}} converge al punto x ,, si se cumple que, cualquiera que sea el entorno V , de x , existe un número natural n0 de tal manera que si n es otro número natural mayor o igual que n0 (o sea, n geq n_0) entonces se cumple que x_n in V.

Hay que hacer dos observaciones sobre esto:

  • En primer lugar, puede darse el caso de que la sucesión no tenga puntos límites, o incluso que tenga más de un punto límite. Al conjunto de puntos límites de una sucesión (x_n)_{n in mathbb{N}} se le denomina límite de (x_n)_{n in mathbb{N}} (y se le denota por lim_{n in mathbb{N}} x_n, o también por , lim_{n to infty} x_n).
  • En segundo lugar, la interpretación de este concepto es la siguiente: tan cerca como queramos de un punto límite podemos encontrar a todos los puntos de la sucesión, excepto a lo más a una cantidad finita de ellos (que podrá o no ser muy grande, pero no deja de ser finita).

Un punto x in X es punto de aglomeración de la sucesión (x_n)_{n in mathbb{N}} si cualquiera que sea el entorno V de x se cumple que el conjunto {n in mathbb{N}: x_n in V} es infinito. Todo punto límite es punto de aglomeración, pero el recíproco no es cierto. Por ejemplo, los límites de oscilación de una sucesión no convergente de números reales (como por ejemplo la sucesión (-1)^n+frac{1}{n} ) son puntos de aglomeración, pero no son puntos límites (no existe límite para dicha sucesión, mientras que 1 y -1 son puntos de acumulación).

[editar] Continuidad de aplicaciones

Otro concepto totalmente fundamental estudiado en esta rama es el de aplicación continua. Una aplicación f :X longrightarrow Y entre dos espacios topológicos se dice que es continua si dado cualquier conjunto G , abierto en Y ,, el conjunto f^{-1}(G) = {x in X : f(x) in G } es un conjunto abierto en X ,.

Con la misma notación, si x in X, diremos que f, es continua en x, cuando se obtiene que , f^{-1}(V) es un entorno de x ,, cualquiera que sea el entorno V, de f(x),.

Es inmediato entonces comprobar que f, es continua cuando y sólo cuando es continua en x in X, cualquiera que sea éste, es decir, cuando y sólo cuando sea continua en cada uno de los puntos de su dominio.

Informalmente hablando, una aplicación es continua si transforma puntos que están cerca en puntos que están cerca, es decir, si respeta la "relación de cercanía". Esto además quiere decir que una función continua no "rompe" los que está unido y no "pega" lo que está separado.

[editar] Conjuntos conexos, conexos por caminos y arco-conexos

Un conjunto se dice que es conexo si no puede expresarse como unión de dos abiertos disjuntos no vacíos.

Un conjunto X, se dice que es conexo por caminos si todo par de puntos puede unirse mediante un camino, esto es, ,forall x,y in X quad exist phi : [0,1] longrightarrow X continua de tal manera que ,phi(0)=x y ,phi(1)=y. Todo conjunto conexo por caminos es conexo, pero no todo conjunto conexo es conexo por caminos.

Estos conjuntos están "hechos de una pieza" (los conexos) o "hechos de manera que no tienen piezas totalmente sueltas" (los conexos por caminos). Naturalmente esto es sólo una manera de interpretarlos. Las piezas de un conjunto (los mayores subconjuntos conexos que contiene el conjunto) se denominan "componentes conexas". Por ejemplo, un puñado de arena sería un conjunto en el que las componentes conexas son cada granito de arena. Un espejo roto sería un conjunto en el que cada trozo de espejo es una componente conexa. Una bola de hierro es un conjunto con una sola componente conexa, es decir, un conjunto conexo. Una rejilla también es un conjunto conexo, formado por una sola componente conexa.

Existe otra noción de conexión, la conexión por arcos o arco conexión ligeramente más restrictiva que la conexión por caminos. Se exige que el camino sea un homeomorfismo sobre su imagen. Aun así, la conexión por arcos y por caminos coinciden sobre los espacios de Haudorff.

[editar] Compacidad

Los conjuntos compactos son un tipo de conjunto mucho más difíciles de definir. En el espacio euclidiano un conjunto es compacto si cumple dos condiciones: es "cerrado", es decir contiene a todos sus puntos frontera; y es "acotado", es decir es posible trazar una bola que lo contenga. La compacidad es una propiedad muy importante en Topología, así como en Geometría y en Análisis Matemático.

[editar] Metrización

Una topología sobre un conjunto es metrizable si es posible encontrar una distancia de forma que los abiertos para esa distancia sean exactamente los abiertos de la topología de partida. La metrizabilidad es también una propiedad muy deseable en un espacio topológico, pues nos permite dar una caracterización muy sencilla de los abiertos de la topología, además de implicar otras ciertas propiedades.

[editar] Separación

Las propiedades de separación son ciertas propiedades, cada una un grado más restrictiva que la anterior, que nos indican la "resolución" o "finura del grano" de una topología. Por ejemplo, la propiedad de separación T2 significa que para dos puntos distintos siempre pueden encontrarse entornos disjuntos (es decir que no se cortan).

[editar] Densidad

Un conjunto es denso en el espacio si está "cerca de todos los puntos" de ese espacio. De manera más precisa, un conjunto es denso si su clausura es todo el espacio. Un conjunto se dice que es separable si tiene algún subconjunto denso y numerable.

[editar] Topología producto y Topología cociente

La topología producto nos proporciona una manera de dotar de una topología al producto cartesiano de varios espacios topológicos, de tal manera que se conserven buenas propiedades, en particular que las proyecciones sobre cada factor sean aplicaciones continuas y abiertas. La topología cociente nos proporciona una manera de dotar de una topología al cociente (espacio de clases) de un espacio por una relación de equivalencia, de manera que tenga el mayor número posible de conjuntos abiertos y sin embargo la proyección sea continua (es decir la imagen recíproca de cada abierto sea un abierto).

[editar] Topología Algebraica

La Topología Algebraica estudia ciertas propiedades relacionadas con la conexión de un espacio, propiedades que podríamos describir como la "porosidad" de un espacio, la cantidad de boquetes que presenta. Para ello se vale de instrumentos algebraicos, fundamentalmente la Teoría de Grupos y el Álgebra Homológica, hasta tal punto que su desarrollo es totalmente algebraico.

En la Topología Algebraica se consideran una gran diversidad de problemas incluidos en la Teoría de nudos por ejemplo, o en la Teoría de Homotopías y la Teoría de Homología.

Para comprender sucintamente estas cuestiones, volvamos a los ejemplos de conjuntos conexos. Según hemos dicho, una rejilla, una bola de hierro o una esponja son conjuntos conexos. Sin embargo todos entendemos que parece que no tienen el mismo "grado de conexión", por expresarlo de alguna manera. Mientras que una bola de hierro es maciza, una esponja y una rejilla tienen agujeros, e incluso parece claro que entre estos hay también una cierta diferencia. La Homotopía y la Homología tratan estas cuestiones.

[editar] Notas

  1. Stewart, Ian: Conceptos de matemática moderna. Alianza Universidad, 1988. p. 171.

[editar] Véase también

[editar] Enlaces externos

07/11/2010 10:19 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿HAY ALGUNA RELACIÓN ENTRE LA MAGIA Y LAS CORRESPONDENCIAS MATEMÁTICAS?. Dados dos conjuntos: X e Y, y un Grafo f, que determina alguna Relación binaria entre algún elemento de X con algún elemento de Y, diremos que ese grafo: f, define una correspondencia[1] entre X e Y, que representaremos: cuando al menos un elemento de X está relacionado con al menos un elemento de Y.

Correspondencia matemática

De Wikipedia, la enciclopedia libre
Correspondencia subtipos 02.svg

Dados dos conjuntos: X e Y, y un Grafo f, que determina alguna Relación binaria entre algún elemento de X con algún elemento de Y, diremos que ese grafo: f, define una correspondencia[1] entre X e Y, que representaremos:

 fcolon X rightarrow Y

cuando al menos un elemento de X está relacionado con al menos un elemento de Y.

Contenido

[ocultar]

[editar] Un ejemplo

Correspon 00.svgCorrespon 01.svg
Correspon 02.svgCorrespon 04.svg

Si tenemos una serie de objetos, como los tubos de pintura y los pinceles, y diferenciamos por un lado los tubos y por otro los pinceles, y asociamos a cada tubo el pincel que tiene el mismo color de pintura, tenemos una relación color de la pintura entre cada tubo y cada pincel que tenga el mismo color.

Correspon 20.svg
Correspon 21.svg
Correspon 22.svg
Correspon 23.svg
Correspon 24.svg
Correspon 25.svg

En este ejemplo, podemos definir un conjunto T de tubos de pintura y otro P de pinceles y asociar a cada tubo del conjunto T, el pincel del conjunto P que tenga su mismo color, esta asociación la representaremos con una flecha del tubo al pincel correspondiente.

Puede darse el caso que tengamos un tubo de un color pero no un pincel con el mismo color de pintura, como en el ejemplo hay un tubo de color rojo pero no hay ningún pincel con pintura de color rojo, por lo tanto del tubo rojo no sale ninguna flecha.

Puede que tengamos un tubo de un color y varios pinceles con pintura de ese mismo color, así en el ejemplo hay un tubo verde y dos pinceles con pintura verde, del tubo de color verde salen dos flechas una hasta cada pincel con pintura verde.

Correspon 0101.svg

También puede ser que tengamos más de un tubo de un mismo color y un solo pincel con esa pintura, en este caso, como en el ejemplo, de los dos tubos azules salen las dos flechas hasta el único pincel con pintura azul, llegando dos flechas al pincel azul, una de cada uno de los tubos de color azul, como se ve en la figura.

En la figura del ejemplo se ve un pincel con pintura amarilla, pero no hay ningún tubo de pintura amarilla, por tanto a este pincel no llega ninguna flecha.

En resumen la correspondencia mismo color de la pintura entre un conjunto T de tubos de pintura, y otro conjunto P de pinceles, existe en tanto en cuanto al menos un tubo de pintura tiene el mismo color que uno de los pinceles, pudiendo ser esa relación tan sencilla o tan compleja como se quiera.

En una correspondencia matemática los conjuntos no tienen que ser necesariamente numéricos, ni la relación entre sus elementos operaciones aritméticas, sin que por ello deje de ser matemática.

[editar] Definiciones

Correspondencia 01.svg
Correspon 0602.svg

En una correspondencia podemos distinguir distintos conjuntos:

  • Conjunto inicial: es el primero de la correspondencia, es este caso X, lo representaremos: in(f), según el ejemplo:
 X = {rm in}(f) = {1, 2, 3, 4 } ,

En el segundo ejemplo, tenemos una correspondencia entre un conjunto de pinceles P y un conjunto de caras C que hemos pintado con esos pinceles, la correspondencia asocia a cada pincel la cara del mismo color, en este ejemplo el conjunto inicial será:

 P = {rm in}(color) = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P1.svg } ,
  • Conjunto final: es el segundo de la correspondencia en este caso Y, lo representaremos como fin(f), según el ejemplo:
 Y = {rm fin}(f)= {a, b, c, d } ,

En el ejemplo de los pinceles y las caras el conjunto final está formado por:

 C = {rm fin}(color) = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C5.svg } ,
  • Conjunto origen: es el formado por los elementos del conjunto inicial, que están relacionados con algún elemento del conjunto final, lo representaremos or(f), en el ejemplo será:
 {rm or}(f)= {2, 3 } ,

Los pinceles de los que hay una cara pintada es el conjunto origen, de la correspondencia mismo color:

 {rm or}(color) = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg } ,
  • Conjunto imagen: es el formado por los elementos del conjunto final con los que están relacionados los elementos del conjunto origen, lo representaremos Im(f), en el ejemplo:
 {rm Im}(f) = { c, d } ,

Las caras para las que hay un pincel de su color es el conjunto imagen:

 {rm Im}(color) = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg } ,
  • Elementos homólogos: dos elementos, uno del conjunto origen y otro del conjunto imagen, se dice que son homólogos, si están relacionados según la correspondencia f, en el ejemplo los siguientes pares ordenadas son homólogos:
 (2, d), ; (3, c)

Los pares ordenados formados por un pincel y una cara del mismo color son:

 ( , Correspon P0.svg, Correspon C0.svg ) , ( , Correspon P2.svg, Correspon C2.svg ) , ( , Correspon P4.svg, Correspon C4.svg ) ,
  • Imagen de un elemento: dado un elemento x del conjunto origen, y otro elemento y del conjunto imagen, se dice que y es imagen de x y se representa:
 f(x) = y ,

si el elemento x está relacionado con el elemento y según la correspondencia f. en el ejemplo tenemos que:

 f(2) = d ,  f(3) = c ,

La correspondencia color por la que a cada pincel se le asocia la cara pintada del mismo color es:

 {rm color}( , Correspon P0.svg  ) = , Correspon C0.svg
 {rm color}( , Correspon P2.svg  ) = , Correspon C2.svg
 {rm color}( , Correspon P4.svg  ) = , Correspon C4.svg

[editar] Correspondencia definida a partir del producto cartesiano

Dados los conjuntos X (Conjunto inicial) e Y (Conjunto final) y definido el producto cartesiano  X times Y , de estos dos conjuntos, como el conjunto de pares ordenados (x, y), donde  x in X  e  y in Y  , dado el conjunto F que contiene a los pares homónimos de la correspondencia f, y  F subset ( X times Y ) define esa correspondencia en su totalidad.

Por lo tanto podemos decir que una correspondencia entre dos conjuntos X e Y, es un subconjunto F del producto cartesiano  X times Y , que recoge los pares ordenados (x, y), que forman la correspondencia.

[editar] ejemplo 1

d(1,d)(2,d)(3,d)(4,d)
c(1,c)(2,c)(3,c)(4,c)
b(1,b)(2,b)(3,b)(4,b)
a(1,a)(2,a)(3,a)(4,a)
X×Y1234

en la diagrama anterior, tenemos los conjuntos:

 X = {1, 2, 3, 4 } , Y = {a, b, c, d } ,

el producto  X times Y es:

 X times Y  = { , (1,a), , (1,b), , (1,c), , (1,d),  
   (2,a), , (2,b), , (2,c), , (2,d),  
   (3,a), , (3,b), , (3,c), , (3,d),
   (4,a), , (4,b), , (4,c), , (4,d)  } ,

el conjunto F es el siguiente:

 F = { ( 2, d ), ( 3, c ) } ,

se puede apreciar que  F subset ( X times Y ) y que F define la correspondencia en su totalidad.

[editar] ejemplo 2

Correspon 0601.svg

Partiendo de la correspondencia entre los tubos de pintura T, y los pinceles P, asociando a cada tubo el pincel que tiene pintura del mismo color.

La correspondencia vendrá definida por los pares ordenados:

 F = { ( , Correspon T0.svg, Correspon P0.svg ) , ( , Correspon T2.svg, Correspon P2.svg ) , ( , Correspon T4.svg, Correspon P4.svg ) } ,

Vemos que el conjunto inicial es:

 T = { , Correspon T0.svg,Correspon T2.svg,Correspon T4.svg,Correspon T5.svg } ,

y el conjunto final:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P1.svg } ,

 

Correspon P1.svgCorresCartesi 10.svgCorresCartesi 12.svgCorresCartesi 14.svgCorresCartesi 15.svg
Correspon P4.svgCorresCartesi 40.svgCorresCartesi 42.svgCorresCartesi 44.svgCorresCartesi 45.svg
Correspon P2.svgCorresCartesi 20.svgCorresCartesi 22.svgCorresCartesi 24.svgCorresCartesi 25.svg
Correspon P0.svgCorresCartesi 00.svgCorresCartesi 02.svgCorresCartesi 04.svgCorresCartesi 05.svg
 Correspon T0.svgCorrespon T2.svgCorrespon T4.svgCorrespon T5.svg

el producto cartesiano de T por P es el conjunto de pares ordenados de cada uno de los tubos de T con cada uno de los pinceles de P, en la cuadricula podemos ver en la fila inferior cada uno de los tubos del conjunto T, y en la columna da la izquierda cada uno de los pinceles del conjunto P, donde se cortan una fila y una columna están el tubo y el pincel correspondientes, se ha destacado el fondo de las pares que forman parte de la correspondencia.

[editar] Correspondencia inversa

Correspon 0601.svg
Correspon 0600.svg

Dada una correspondencia entre los conjuntos A y B, representada:

 f: A rightarrow B

se define como correspondencia inversa de f, que llamaremos  f^{-1} ,:

 f^{-1}: B rightarrow A

a la que asocia la imagen de la función f con su origen.

Definida una correspondencia F, como un subconjunto del producto cartesiano de  A times B , donde los pares ordenados (a, b) son los asociados por la correspondencia, la correspondencia inversa  F^{-1} ,, es el subconjunto del producto cartesiano  B times A , formado por los pares ordenados (b, a) obtenidos de cambiar el orden de la correspondencia F.

Así si tenemos un conjunto T de tubos de pintura y otro conjunto P de pinceles y asociamos por una relación f a cada tubo de T el pincel con pintura del mismo color:

 f: T rightarrow P

y esta función está definida por los pares ordenados:

 , (  Correspon T0.svg, Correspon P0.svg ) , , (  Correspon T2.svg, Correspon P2.svg ) , , (  Correspon T4.svg, Correspon P4.svg ) ,

La correspondencia inversa será la que partiendo del conjunto de pinceles P asocia a cada pincel el tubo del conjunto T de pintura del mismo color:

 f^{-1}: P rightarrow T

que estará definida por los pares ordenados:

 , (  Correspon P0.svg, Correspon T0.svg ) , , (  Correspon P2.svg, Correspon T2.svg ) , , (  Correspon P4.svg, Correspon T4.svg ) ,

[editar] Tipos de correspondencias

[editar] Clasificación según la unicidad

Conjuntos 04.svg

Partiendo de dos conjuntos, uno inicial X, y otro final Y, y todas las posibles correspondencias que se pueden hacer entre estos dos conjuntos, por su interés podemos diferenciar las correspondencias unívocas y biunívocas.

  • Una correspondencia es unívoca si cada elemento inicial solo tienen una imagen.
Informalmente: "si sólo sale una flecha de cada elemento del conjunto inicial que tenga imagen"
  • Una correspondencia es biunívoca si cada elemento inicial solo tienen una imagen, y cada elemento imagen solo tiene un origen.
Informalmente: "si sólo sale una flecha de cada elemento del conjunto inicial que tenga imagen y a cada elemento del conjunto final con origen sólo le llegue una flecha"

No es necesario en ninguno de los dos casos, que todos los elementos de X tengan una imagen, ni que todos los elementos de Y tengan un origen, claramente una correspondencia tiene que ser unívoca para poder ser biunívoca.

Si representamos con un rectángulo todas las posibles correspondencias entre los conjuntos X e Y, si el conjunto B es el de las correspondencias unívocas, y al A el de las biunívocas, en un Diagrama de Venn, se ve claramente que el conjunto de las correspondencias biunívocas es un subconjunto de las correspondencias unívocas.

[editar] Correspondencia no unívoca

Correspondencia 02.svg
  • Es la correspondencia en la que al menos uno de los elementos origen tiene dos o más imágenes. En el diagrama de Venn, son las correspondencias que no pertenecen a B: B’

Si el conjunto inicial es el de los alumnos de un centro escolar, y el conjunto final el de las asignaturas que se imparten en ese centro, la correspondencia de alumnos con asignaturas, no será unívoca cuando al menos un alumno estudia dos o más asignaturas.

En el diagrama de la figura el elemento 3 tiene dos imágenes b y c, esto hace que la correspondencia no sea unívoca, independientemente de la relación que tengan el resto de los elementos. Esta doble imagen para un único origen da lugar a que podamos decir:

 f(3) = b ,  f(3) = c ,

Siendo las dos expresiones ciertas.

[editar] Correspondencia unívoca

Artículo principal: Correspondencia unívoca
  • Es una correspondencia donde cada elemento del conjunto origen se corresponde con solo un elemento del conjunto imagen.

En el diagrama de Venn son las correspondencias que pertenecen a B.

[editar] Correspondencia unívoca, no biunívoca

Correspondencia 03.svg
  • Es la que a cada origen le corresponde una única imagen, pero no todas las imágenes tienen un único origen. En el diagrama de Venn, son las correspondencias que pertenecen a B pero no a A: B-A.

Si el conjunto inicial es el de las personas de una población, y el conjunto final el de los domicilios de esa población, la correspondencia de personas con domicilios, será unívoca pero no biunívoca cuando, cada persona viva en un único domicilio y en algún domicilio vivan varias personas.

La correspondencia representada en este diagrama es unívoca, pero no es biunívoca porque el elemento d, tiene dos orígenes: 1 y 2. Así tenemos que:

 f(1) = d ,  f(2) = d ,

esto hace que no sea una correspondencia biunívoca, aunque por el resto de las relaciones si pueda serlo.

[editar] Correspondencia biunívoca

Artículo principal: Correspondencia biunívoca

Es decir: cada elemento del conjunto origen se corresponde con solo un elemento del conjunto imagen, y cada elemento del conjunto imagen se corresponde con solo un elemento del conjunto origen.

En el diagrama de Venn son las correspondencias que pertenecen a A.

Ejemplos

Correspondencia 04.svg
  • En el diagrama de la figura se ve que:
 f(2) = a ,  f(3) = b ,  f(4) = d ,

siendo estas todas las relaciones de esta correspondencia. Los elementos origen tienen una única imagen, y los elementos imagen tienen un único origen, puede haber elementos sin imagen como el 1, y elementos sin origen como la c, pero esto no influye en la definición de biunicidad.

  • Si consideramos como conjunto origen el de personas, y por conjunto imagen el de automóviles, esta correspondencia será biunívoca cuando las personas que tienen automóvil tienen un solo automóvil, y cada automóvil tenga un solo propietario.
  • Se puede establecer una correspondencia biunívoca entre cada número natural con su cuadrado.
  • Otro ejemplo podría ser una correspondencia biunívoca entre cada estudiante con su número de legajo.
  • Una relación biunívoca muy utilizada e independiente de otros valores es la existente entre el valor de la propiedad termométrica utilizada y el valor numérico de la temperatura asignada. Esto es que cada valor de temperatura se corresponde únicamente con un valor de la escala del termometro y cada valor de la escala del termometro se corresponde únicamente con un valor de temperatura.

[editar] Aplicación matemática

Aplicación 2.svg
Artículo principal: Función matemática

Dada una correspondencia matemática entre todos los elementos del conjunto X con los elementos del conjunto Y, diremos que esta correspondencia: f, es una Aplicación [2] [3] [4] [5] entre X e Y, que suele llamarse función matemática[6] si los conjuntos inicial y final son numéricos y se represente:

 f: X rightarrow Y
  • Cuando:
  1. Todos los elementos de X están relacionados con elementos de Y.
  2. Cada elemento de X, está relacionado con un único elemento de Y.

Vulgarmente: todos los elementos del conjunto origen tienen flecha y sólo una

Esto es: una correspondencia matemática es una aplicación, si todos los elementos del conjunto inicial tienen una imagen y solo una imagen.

En el diagrama se pueden ver los conjuntos X e Y:

d(1,d)(2,d)(3,d)(4,d)
c(1,c)(2,c)(3,c)(4,c)
b(1,b)(2,b)(3,b)(4,b)
a(1,a)(2,a)(3,a)(4,a)
X×Y1234
 X = {1, 2, 3, 4 } , Y = {a, b, c, d } ,

Como se puede ver, a cada uno de los elementos de X le corresponde un único elemento de Y. El elemento a de Y no tiene origen y el elemento b tiene dos orígenes (el 1 y el 4), pero esto no afecta a la definición de aplicación como tipo de correspondencia.

 

[editar] Tipos de Aplicación matemática

Dados dos conjuntos X, Y, y todas las posibles aplicaciones que pueden formarse entre estos dos conjuntos, se pueden diferenciar los siguientes casos:

Conjuntos 01.svg
  • Si a cada imagen le corresponde un único origen, inyectiva.
Vulgarmente: "a cada elemento del conjunto final que tenga origen, le llega sólo una flecha"
  • Si la aplicación es sobre todo el conjunto final, sobreyectiva.
Vulgarmente: "si a todos los elementos del conjunto final les llega una flecha, al menos"

Además de estos dos casos característicos, una aplicación puede ser inyectiva y sobreyectiva simultáneamente, que se denominan biyectiva, o ninguna de ellas en cuyo caso no tiene un nombre especifico.

Vulgarmente: "en una aplicación biyectiva todos los elementos origen tienen una flecha y a todos los elementos imagen, les llega una sola flecha"

Vamos a representar los tipos de aplicaciones en un Diagrama de Venn, el conjunto universal U, representado por un rectángulo, es el de todas las posibles aplicaciones, el conjunto A es el de las aplicaciones inyectivas, y el conjunto B el de las sobreyectivas, esto nos permite ver los distintos tipos de aplicaciones de un modo gráfico.

[editar] Aplicación inyectiva y no sobreyectiva

Aplicación inyectiva y no sobreyectiva

Una aplicación inyectiva cada elemento imagen tendrá un único origen y una no sobreyectiva tendrá al menos un elemento del conjunto final que no tenga elemento origen.

En el diagrama de Venn corresponden a las aplicaciones que pertenecen a A y no pertenecen a B, esto es las que pertenecen a la diferencia de A y B: A-B.

En estas aplicaciones la cardinalidad de X es siempre menor que la de Y, esto es el conjunto Y tendrá mayor número de elementos que X cuando tratamos de compararlos.

[editar] Ejemplo

en el diagrama de la figura:

todos los elementos de Y, que tienen origen, tienen un único origen, esto hace que la aplicación sea inyectivael elemento d de Y, no tiene ningún origen por lo que esta aplicación no es sobreyectiva.
[editar] Segundo ejemplo
Correspon 1402.svg

Partiendo del conjunto de pinceles con pintura de colores:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg } ,

Sobre el conjunto de caras pintadas:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C1.svg } ,

Asociando cada pincel con la cara correspondiente:

Correspon 30.svg

Dado que cada pincel tiene una cara y solo una cara de su color esta correspondencia es una aplicación, como las caras que tiene pincel de su color, tienen un solo pincel de su color, la aplicación es inyectiva, y como la cara pintada de amarillo, no tiene ningún pincel de este color, la aplicación no es sobreyectiva.

[editar] Aplicación no inyectiva y sobreyectiva

Aplicación no inyectiva y sobreyectiva

Una aplicación no inyectiva tiene al menos un elemento imagen que tiene dos o más orígenes y una sobreyectiva todos los elementos del conjunto final tienen al menos un elemento origen.

En el diagrama de Venn corresponden a las aplicaciones que no pertenecen a A y si pertenecen a B, esto es las que pertenecen a la diferencia de B y A: B-A.

Para esta aplicación el conjunto X ha de tener mayor número de elementos que Y, la cardinalidad de X ha de ser mayor que la de Y.

[editar] Ejemplo

en el diagrama de la figura:

el elemento c de Y, tiene dos orígenes: el 3 y el 4, por lo que esta aplicación no es inyectiva.todos los elementos de Y, tienen origen, esto hace que la aplicación sea sobreyectiva.
[editar] Segundo ejemplo
Correspon 1502.svg

Igual que en el ejemplo anterior partiremos del conjunto de pinceles con pintura de colores:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P4.svg } ,

En este caso hay dos pinceles con pintura azul, pero a pesar de tener el mismo color de pintura son dos pinceles distintos.

Como conjunto final tenemos el conjunto de caras pintadas:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg } ,

Asociando cada pincel con la cara del mismo color, vemos que cada pincel tiene una cara pintada de su color y solo una, esto hace que la correspondencia sea una aplicación, la cara azul tiene dos pinceles de su mismo color, por lo que no es inyectiva, todas las caras tiene un pincel con su color, luego la aplicación es sobreyectiva.

[editar] Aplicación inyectiva y sobreyectiva (biyectiva)

Aplicación biyectiva

Si una aplicación es inyectiva y sobreyectiva simultáneamente, se denomina biyectiva. Por ser inyectiva los elementos que tienen origen tienen un único origen y por ser sobreyectiva todos los elementos del conjunto final tienen origen.

En el diagrama de Venn el conjunto A es el de las aplicaciones inyectiva y el conjunto B el de las aplicaciones sobreyectiva, las aplicaciones biyectiva, que son inyectiva y sobreyectiva, será la intersección de A y B.

Estas dos circunstancias dan lugar a que el conjunto X e Y tengan el mismo número de elementos, la cardinalidad de X es la misma que la de Y, esto tiene una gran importancia cuando se pretende comparar dos conjuntos:

  • Si dados dos conjuntos podemos encontrar una aplicación biyectiva entre ellos, podemos afirmar, que los dos conjuntos tienen el mismo número de elementos. La cardinalidad de X es igual a la de Y.
[editar] Ejemplo
f(x)= 2x

en el diagrama de la figura:

todos los elementos de Y, que tienen origen, tienen un único origen, esto hace que la aplicación sea inyectivatodos los elementos de Y, tienen origen, esto hace que la aplicación sea sobreyectiva.

Si tomaremos por conjunto inicial el conjunto de los números naturales:

 X = {1, 2, 3, ... } ,

y por conjunto final el de los números naturales pares:

 Y = {2, 4, 6, ... } ,

Podemos ver que la relación

 f: X rightarrow Y  f: x mapsto 2x

Por el que a cada número natural x de X, le asociamos un número par 2x de Y, se cumple:

  1. f: es una aplicación, dado que a cada uno de los valores x de X le corresponde un único valor 2x de Y.
  2. esta aplicación es inyectiva dado que a cada número par 2x de Y le corresponde un único valor x de X.
  3. y es sobreyectiva porque todos los números pares tienen un origen

Esto nos permite afirmar que hay el mismo número de números naturales que de números naturales pares, se da la paradoja de que los números naturales pares en un subconjunto propio de los números naturales, esta circunstancia solo se da con los conjuntos infinitos.

[editar] Segundo ejemplo
Correspon 1602.svg

Tomando el conjunto de pinceles como conjunto inicial:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P1.svg } ,

y el de caras como conjunto final:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C1.svg } ,

La correspondencia que asocia cada pincel con la cara de su mismo color es una aplicación porque todos los pinceles tienen una cara con su color y solo una cara de ese color, la aplicación es inyectiva porque un pincel corresponde con una sola cara, y es sobreyectiva porque todas las caras tiene un pincel de su color, al ser inyectiva y sobreyectiva simultáneamente esta aplicación es biyectiva.

Una aplicación biyectiva hace corresponder los elementos del conjunto inicial con los del conjunto final uno a uno, pudiéndose decir que hay el mismo número de elementos en el conjunto inicial que en el final.

[editar] Aplicación no inyectiva y no sobreyectiva

Aplicación no inyectiva y no sobreyectiva

Una aplicación no inyectiva tendrá al menos un elemento imagen que tenga dos o más orígenes y una no sobreyectiva tendrá al menos un elemento del conjunto final que no tenga elemento origen. Este tipo de aplicaciones no tiene un nombre especifico y quizá sean las que presenten, desde el punto de vista matemático, un menor interés.

Para esta aplicación los conjuntos X e Y no son comparables, y no podemos plantear ningún supuesto sobre su cardinalidad, partiendo de su comparación, ni sobre su número de elementos.

En el diagrama de Venn corresponden a las aplicaciones que no pertenecen a A y no pertenecen a B, esto es las que no pertenecen a la unión de A y B.

[editar] Ejemplo

en el diagrama de la figura:

el elemento b de Y, tiene dos orígenes: 1 y 2, esto hace que esta aplicación no sea inyectivael elemento a de Y, no tiene ningún origen por lo que esta aplicación no es sobreyectiva
[editar] Segundo ejemplo
Correspon 1302.svg

Si tomamos como conjunto inicial el de pinceles de colores:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P4.svg } ,

y como conjunto final el de caras coloreadas:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C1.svg } ,

Vemos que todos los pinceles tiene una cara y solo una cara de su mismo color, luego esta correspondencia es una aplicación matemática.

Como la cara azul tiene dos pinceles de su color la aplicación no es inyectiva, y como la cara amarilla no tiene ningún pincel de ese color no es sobreyectiva, luego esta aplicación es no inyectiva y no sobreyectiva.

[editar] Véase también

[editar] Bibliografia

  1. Gutiérrez Gómez, Andrés; García Castro, Fernando (1981) (en español). Álgebra lineal (1 edición). Ediciones Pirámide, S.A.. ISBN 978-84-368-0174-3. 

[editar] Referencia

  1. Hurtado, F. (2 de 1997) (en español). Atlas de matemáticas (1 edición). Idea Books, S.A.. pp. 8. ISBN 978-84-8236-049-2. 
  2. Neila Campos (1 de 2003). «ÁLGEBRA LINEAL» (en español) págs. INTRODUCCIÓN: APLICACIONES ENTRE CONJUNTOS..
  3. F. Zotes (9 de 2009). «Cardinalidad de conjuntos» (en español) págs. I. Aplicaciones..
  4. Hurtado, F. (2 de 1997) (en español). Atlas de matemáticas (1 edición). Idea Books, S.A.. pp. 8. ISBN 978-84-8236-049-2. 
  5. Thomas Ara, Luis (9 de 1974). «Tema IV Aplicaciones» (en español). Algebra Lineal. Mª E. Rios Garcia (2 edición). AUTOR-EDITOR 15. pp. 38-54. ISBN 978-84-400-7995-4. 
  6. Gutiérrez Gómez, Andrés; García Castro, Fernando (1981). «3.2. Aplicaciones o funciones» (en español). Álgebra lineal (1 edición). Ediciones Pirámide, S.A.. pp. 131. ISBN 978-84-368-0174-3. 

[editar] Enlaces externos

Correspondencia matemáticaCONJUNTOS, APLICACIONES Y RELACIONES BINARIAS.Aplicaciones matemáticas
02/11/2010 17:06 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: SOFISMAS O FALACIAS. Una falacia o sofisma es, según la definición tradicional, un patrón de razonamiento malo que aparenta ser bueno.[1] Un razonamiento falaz no necesariamente arriba a una conclusión falsa; así como un razonamiento correcto o válido no necesariamente arriba a una conclusión verdadera.[2] Los razonamientos falaces no son falaces por arribar a una conclusión falsa, sino por contener un error en el razonamiento mismo.

Falacia

De Wikipedia, la enciclopedia libre

Una falacia o sofisma es, según la definición tradicional, un patrón de razonamiento malo que aparenta ser bueno.[1] Un razonamiento falaz no necesariamente arriba a una conclusión falsa; así como un razonamiento correcto o válido no necesariamente arriba a una conclusión verdadera.[2] Los razonamientos falaces no son falaces por arribar a una conclusión falsa, sino por contener un error en el razonamiento mismo.

Contenido

[ocultar]

[editar] Ejemplos de razonamientos falaces

Se ilustran errores comunes en un razonamiento. Cabe destacar que la crítica de un razonamiento no tiene relación con la validez de su conclusión. La conclusión puede ser válida, mientras que el razonamiento en sí mismo puede no serlo.

Un ejemplo de un razonamiento falaz podría ser el siguiente:

  1. Juan está enamorado.
  2. A Juan le gusta Carla.
  3. Por tanto, Juan está enamorado de Carla.

Una manera de mostrar que este razonamiento es falaz es utilizando diagramas de Venn. En terminología lógica, el razonamiento no es bueno ya que en al menos una interpretación de las premisas, la conclusión puede ser falsa.

Desafortunadamente, pocos razonamientos falaces son tan claros como el ejemplo anterior. Muchos de ellos involucran causalidad, que no es una parte de la lógica formal. Otras utilizan estratagemas psicológicas como el uso de relaciones de poder entre el orador y el interlocutor, llamamientos al patriotismo, la moralidad o el ego para establecer las premisas intermedias (explícitas o implícitas) necesarias para el razonamiento. De hecho, las falacias se encuentran muy a menudo en presunciones no formuladas o premisas implícitas que no son siempre obvias a primera vista.

Considérese ahora el siguiente argumento:

  1. Germán es un buen jugador de tenis.
  2. Por lo tanto, Germán es 'bueno', esto es, bueno moralmente.

Aquí el problema se encuentra en que la palabra 'bueno' es una palabra ambigua, lo que quiere decir es que tiene diferentes significados. En la premisa, se afirma que Germán es bueno en una actividad particular, en este caso tenis. En la conclusión, se afirma que Germán es bueno moralmente. Éstos son claramente significados distintos de la palabra 'bueno'. Aunque la premisa sea cierta, la conclusión puede ser falsa: Germán puede ser el mejor jugador de tenis del mundo y al mismo tiempo ser malvado.

Considérese ahora la siguiente variante humorística de la falacia de la ambigüedad:

  1. Una hamburguesa es mejor que nada.
  2. Nada es mejor que la felicidad eterna.
  3. Por tanto, una hamburguesa es mejor que la felicidad eterna.

Este razonamiento tiene la apariencia de una inferencia que aplica transitividad en la relación «es mejor que», que en principio es posible, el problema está dado por el significado de nada. En este caso, es un ejemplo de ambigüedad semántica. En la primera premisa, palabra «nada» significa la ausencia absoluta de cualquier cosa, mientras que en la segunda premisa, la palabra «nada» significa que no existe cosa que sea mejor que felicidad eterna. No hay que pensar en "ninguna cosa" como un objeto en si, sino como la abstracción de la "no existencia".

Ejemplos cotidianos:

  1. El oro brilla.
  2. Esta daga brilla.
  3. Por lo tanto, esta daga es de oro.

Este es un ejemplo de falacia de afirmación de consecuente. Esta falacia tiene la forma:

  1. A es B
  2. C es B
  3. Por lo tanto, C es A

Por definición, cuando un razonamiento es correcto y sus premisas son verdaderas, entonces su conclusión también es verdadera. En este caso, tenemos que las premisas son verdaderas y la conclusión no necesariamente verdadera, ya que la daga puede ser de oro (siendo verdadera) o de otro material brillante como por ejemplo el hierro (siendo falsa). Por tanto, el argumento es incorrecto. La manera de saberlo es empleando contraejemplos que lleven al límite estas estructuras falaces.

[editar] Falacias en los medios de comunicación y la política

Las falacias se usan frecuentemente en artículos de opinión en los medios de comunicación y en política. Cuando un político le dice a otro «No tienes la autoridad moral para decir X», puede estar queriendo decir dos cosas:

  • Usar un ejemplo de la falacia del ataque personal o falacia ad hominem, esto es, afirmar que X es falsa atacando a la persona que la afirmó, en lugar de preocuparse de la veracidad de X.
  • No ocuparse de la validez de X, sino hacer un crítica moral al interlocutor (y de hecho es posible que el político esté de acuerdo con la afirmación). En este último caso, la falacia consiste en evadir el tema, dando sólo una opinión personal, no relevante, sobre la moralidad del otro.

Es difícil, por ello, distinguir falacias lógicas, ya que dependen del contexto.

Otro ejemplo, muy extendido es el recurso al Argumentum ad verecundiam o falacia de la autoridad. Un ejemplo clásico es el Ipse dixit («Él mismo lo dijo») utilizado a lo largo de la edad media para referirse a Aristóteles. Un ejemplo más moderno es el uso de famosos en anuncios: un producto que deberías comprar/usar/apoyar sólo porque tu famoso favorito lo hace.

Una referencia a una autoridad siempre es una falacia lógica, aunque puede ser un argumento racional si, por ejemplo, es una referencia a un experto en el área mencionada. En este caso, este experto debe reconocerse como tal y ambas partes deben estar de acuerdo que su testimonio es adecuado a las circunstancias. Esta forma de argumentación es común en ambientes legales.

Otra falacia muy usada en entornos políticos es el Argumentum ad populum, también llamado sofisma populista. Esta falacia es una variedad de la falacia ad verecundiam: consiste en atribuir la opinión propia a la opinión de la mayoría y deducir de ahí que si la mayoría piensa eso es que debe ser cierto. En cualquier caso muchas veces la propia premisa de que la mayoría piense eso puede ser falsa o cuando menos dudosa ya que, en muchos casos, dicha afirmación no puede ser probada más que con algún tipo de encuesta que no se ha realizado. En caso de ser cierto tampoco se justifica el razonamiento porque la mayoría piense eso. Se basa en la falsa intuición de que el pueblo tiene autoridad, tanta gente no puede estar equivocada. Se suele oír con frases del tipo todo el mundo sabe que..., o ...que es lo que la sociedad desea', así como la mayoría de los españoles sabe que....

Por definición, razonamientos que contienen falacias lógicas no son válidos, pero muchas veces pueden ser (re) formulados de modo que cumplan un modo de razonamiento válido. El desafío del interlocutor es encontrar la premisa falsa, esto es, aquella que hace que la conclusión no sea firme.

[editar] Aplicación de los prejuicios: las falacias lógicas

Caballo de Troya utilizado en la película Troya (2004). Si se niega el antecedente, entonces se negará también la consecuencia.
Artículo principal: Lista de prejuicios cognitivos

La falacia lógica es un modo o patrón de razonamiento que siempre o casi siempre conduce a un argumento incorrecto. Esto es debido a un defecto en la estructura del argumento que lo conduce a que este sea inválido. Las falacias lógicas suelen aprovecharse de los prejuicios o sesgos cognitivos para parecer lógicas. Cambiándose a veces, el error inconsciente o involuntario por una manipulación deliberada. Por eso, las falacias lógicas son los mecanismos automáticos más comunes para poner en práctica los sesgos cognitivos. Algunas importantes falacias lógicas que emplean los sesgos cognitivos se muestran a continuación. Véase también control social, control mental, propaganda, lavado de cerebro.

[editar] Falacias formales o sofismas

  • Argumento de la falacia o ad logicam: asume que si un argumento es una falacia entonces su conclusión debe ser forzosamente falsa. Una falacia lógica no es necesariamente errónea en su conclusión, aunque sí lo es en el razonamiento que le ha llevado a esta conclusión. Es decir, aunque la estructura de razonamiento pueda ser falaz por su construcción o por sus premisas, la conclusión puede llegar a ser fortuitamente correcta.
    • Ejemplo: «Los objetos caen porque hay ángeles que los empujan hacia abajo». La afirmación «los objetos caen», es cierta, aunque no existe un argumento válido para aceptar la premisa de la existencia de los ángeles y tampoco de que éstos empujen los objetos.
  • Confirmación sistemática o afirmación de la consecuencia: En pocas palabras, la confirmación sistemática, es el equivalente lógico a asumir la verdad necesaria de que lo contrario también lo es. Es llamada así porque erróneamente se concluye que el segundo término de una premisa consecuente establece también la verdad de su antecesora. Si se demuestra que P entonces Q, entonces erróneamente se puede deducir que si Q entonces P llevándonos a esta falacia, que se apoya en el sesgo de simetría.
    • Ejemplo: si estoy dormido tengo los ojos cerrados, entonces si tengo los ojos cerrados debo estar dormido.
  • Negación del antecedente o implicación vacua: Es una falacia lógica con semejanzas con el argumento de la falacia. En este caso si P entonces Q si niego P entonces tampoco Q (se niega Q). Esta falacia dice que si se niegan los antecedentes entonces se negará también la consecuencia.
    • Ejemplo: «Si estoy dormido tengo los ojos cerrados, pero si estoy despierto tengo que estar con los ojos abiertos» «Si no lo digo no me critican, por lo que si lo digo me criticarán». Algo que no tiene que ser necesariamente cierto. Otra vez se aplica el sesgo de simetría o ilusión de serie.

[editar] Falacias por generalización de inducción errónea

En lógica, se designa como inducción a un tipo de razonamiento que va de lo particular a lo general (concepción clásica) o bien a un tipo de razonamiento en donde se obtienen conclusiones tan sólo probables (concepción más moderna). La inducción matemática es un caso especial, donde se va de lo particular a lo general y, no obstante, se obtiene una conclusión necesaria. Típicamente, el razonamiento inductivo se contrapone al razonamiento deductivo, que va de lo general a lo particular y sus conclusiones son necesarias (véase razonamiento inductivo).

  • Muestra sesgada: Es una muestra que ha sido falsamente considerada como la típica de una población de la cual ha sido tomada.
    • Ejemplo: Alguien puede decir «A todo el mundo le gustó la película» sin mencionar que «todo el mundo» fue él y tres de sus compañeros, o un grupo que son fans del artista. Los sondeos online y las muestras por llamadas voluntarias son un tipo particular de este error, porque las muestras están implícitamente preseleccionadas o autoseleccionadas. En el mejor de los casos, esto significa que las personas que se preocupan más sobre el asunto responderán u opinarán y en el peor de los casos, sólo aquellas que sintonicen una radio particular, un periódico particular o una lista política.
  • Falacia del centro de atención: Se produce cuando una persona sin criterio asume que todos los miembros o casos de un cierto grupo, clase o tipo son como esos pocos en el punto de mira, que reciben la mayor atención o cupo de atención de los medios. Esta línea de razonamiento es falaz y conduce a los tópicos. Si los medios publicitan a un asesino en serie de una población no quiere decir que todos los miembros de la población sean asesinos.
  • Falacia de la verdad a medias: Las verdades a medias son frases engañosas y falsas, que incluyen algún elemento de verdad. Las frases pueden ser parcialmente verdad, la frase pueden ser incluso verdad pero no toda la verdad del conjunto lo que produce un engaño provocado por omisión. Pueden incluir algunos elementos engañosos como signos de puntuación, especialmente si se intenta engañar, evadir la culpa o malinterpretar la verdad. El propósito de las medias verdades o verdades a medias es hacer parecer algo que solo es una creencia como un conocimiento o verdad absoluta. De acuerdo con la teoría de conocimiento de creencia de verdad justificada o teoría de la justificación, para saber si una determinada proposición es verdadera, uno debe no solo creer en la verdadera e importante proposición sino también debe tener una buena razón o argumentos para hacerlo. Una verdad a medias embauca al receptor presentando algo que es creíble y usando esos aspectos de la idea que pueden ser demostrados verdaderos como buena razón para creer que la idea o declaración entera es verdadera. Una persona engañada por una verdad a medias podrá considerar la proposición o declaración como una verdad absoluta y actuar en consecuencia. En política, las verdades a medias son una parte integral de las democracias representativas o parlamentarias. La reputación de un candidato político podrá ser irremediablemente dañada si él o ella es expuesto como mentiroso, así un complejo estilo de lenguaje ha evolucionado para minimizar las probabilidades de que ocurra esto. Si alguien no ha dicho algo, entonces ellos no podrán acusarlo de mentir. En consecuencia los políticos se han convertido en un conjunto en el que las medias verdades abundan y son esperadas, dañando la credibilidad del conjunto.
    • Ejemplo: «El sol se pone por el oeste». Esta es una verdad a medias porque aunque en la mayor parte del mundo esto es así no ocurre en los polos en los que durante unos meses el sol ni siquiera llega a ponerse. De hecho, el Sol ni siquiera se pone, porque no es el que se mueve sino que es el movimiento rotatorio de la Tierra el que produce este efecto. Por eso, si se tratara como una verdad absoluta digamos para navegación podría ocurrir un desastre.
Un niño de Palestina sostiene un cartel que dice: «No somos terroristas». No todas las personas que viven en Oriente Medio son terroristas, presunsión extendida a consecuencia de la propaganda estadounidense en la llamada "Guerra contra el terrorismo". Véase «falacia de generalización apresurada».
  • Generalización apresurada o falacia de estadística insuficiente o falacia de muestras insuficientes, ley de los pequeños números, inducción apresurada, falacia del hecho aislado, o secundum quid: Es una falacia lógica en la que se llega a una generalización inducida basada en muy pocas evidencias.
    • Ejemplo: «Me encanta esta canción, por lo tanto me gustará también todo el álbum en el que está». Es una falacia porque el álbum puede no ser tan bueno como la canción escuchada.
  • Falsa vivencia o vivencia desorientadora: es una falacia lógica que usa la descripción de un acontecimiento en extremo detalle —incluso si este es un suceso excepcional y muy poco probable— para convencer a alguien de que hay un problema. Aunque la vivencia sea falsa o verdadera y no tenga ningún fundamento lógico (es decir, aunque sea un disparate) puede tener un gran poder y efecto psicológico debido al sesgo cognitivo denominado disponibilidad heurística. La falacia no reside en la historia misma, la cual, podría llegar a ser cierta, sino en el efecto de gran distorsión probabilística o sesgo que se produce en el receptor en relación al alcance, importancia y relevancia con la decisión a tomar. Esta distorsión o sesgo que se desencadena en el cerebro es un mecanismo poderoso producido por los sesgos cognitivos tendencia de riesgo cero, aversión de pérdida y efecto el último evento cuando se apela al miedo. Véase también programación neurolingüística y la verdad en la pnl. En entornos comerciales y de márketing se usa con frecuencia esta falacia generando lo que se denomina FUD, Fear, uncertainty and doubt que es el acrónimo en inglés de miedo, incertidumbre y duda.
    • Ejemplo: Pedro dice «Creo que dejaré los deportes de riesgo ahora que tengo niños. Creo que me pasaré al golf». Juan responde: «Yo no haría eso. ¿Recuerdas a Javi? Él estaba jugando al golf cuando le atropellaron con el coche que transporta los palos. Se rompió una pierna y rodó hasta golpearse la cabeza. Estuvo en el hospital durante una semana y todavía cojea. Yo seguiría haciendo parapente».
  • Falacia arreglo de bulto: consiste en asumir que las cosas que con frecuencia han sido agrupadas por tradición o cultura en un conjunto deberían estar siempre agrupadas de ese modo. Esta falacia es muy usual en los argumentos políticos: «Mi oponente es un conservador que votó en contra de los altos impuestos y la asistencia pública, por tanto él también se opondrá al control de armas y al aborto». Mientras estas cuatro posiciones están normalmente agrupadas en la palabra «conservador» en política, no hay realmente ninguna razón para pensar que alguien que sigue una idea agrupada en ese grupo deba seguir las demás.
  • Falso dilema o falsa dicotomía o falsa bifurcación: Implica una situación en la cual solo dos puntos de vista son sopesados como las únicas opciones, cuando, en realidad, existen una o más opciones que no han sido consideradas. Las dos alternativas presentadas suelen ser, aunque no siempre, los puntos extremos del espectro de ideas. En lugar de esta extrema simplificación y pensamiento deseado, sería más apropiado considerar todo el espectro de opciones como en la lógica difusa. Véase sesgo de simetría para entender sus causas.
  • Probar con ejemplo o generalización inapropiada o Accidente (falacia): Es una falacia lógica donde se dice que uno o más ejemplos «prueban» un caso más general. Esta falacia tiene la estructura siguiente: Sé que el caso X de todos los X hace o tiene la propiedad P, entonces todo X tiene la propiedad P.
    • Ejemplo: «He visto a hombres (Pedro y Juan) jugar bien al fútbol, por consiguiente todos los hombres juegan bien al fútbol». Véase el artículo «falacia arreglo de bulto» o generalización apresurada. Todas las citadas son falacias de generalización las cuales se pueden agrupar dentro de una de las trece falacias identificadas por Aristóteles; la falacia de destrucción de la excepción o accidente (falacia) a dicto simpliciter ad dictum secundum quid. Ejemplo: 1) Cortar a personas con cuchillos es un crimen [aunque en algunos casos esto no es cierto; es permisible, por ejemplo, en defensa propia]; 2) los cirujanos cortan a las personas con cuchillos; 3) los cirujanos son criminales.

[editar] Falacias de causa informal o causa cuestionable

Las falacias de causa informal, causa cuestionable o falacia causal o non causa pro causa (‘sin motivo para la causa’) o causa falsa, son falacias informales donde una causa es identificada de manera incorrecta.

  1. Cum hoc, ergo propter hoc.
  2. Falacia de la causa simple.
  3. Circularidad entre causa y consecuencia.
  4. Petición de principio.
  5. falacia de las muchas preguntas
  6. Post hoc, ergo propter hoc.
  7. Non sequitur.
  8. Falacia del retroceso.
  9. Falacia del francotirador.
  10. Falacia de dirección incorrecta.
  11. Argumentum ad consequentiam.
  12. Argumentum ad baculum.
  13. Falacia del punto medio.
  14. Recurso de probabilidad.
  • Cum hoc, ergo propter hoc: o la correlación o relación entre dos implica que uno es causa y otro efecto, que afirma que dos eventos que ocurren a la vez tienen necesariamente una relación causa-efecto. Se expresa de la siguiente manera: si ocurre A y correlacionadamente después ocurre B entonces A ha causado a B. Esta falacia hace una conclusión prematura de la causalidad incluso sin evidencias que la soporten. Esto es una falacia lógica porque aunque probable existen al menos otras cuatro posibilidades; 1. que B sea la causa de A; 2. que haya un tercer factor desconocido que sea realmente la causa de la relación entre A y B; 3. que la relación sea tan compleja y numerosa que los hechos sean simples coincidencias y 4. que B sea la causa de A y al mismo tiempo A sea la de B, es decir, que estén de acuerdo, que sea una relación sinérgica o simbiótica donde la unión cataliza los efectos que se observan.
    • Ejemplo: Investigaciones científicas afirman que las personas que usan marihuana (A) tienen una mayor ascendencia en desórdenes psiquiátricos (B) comparados con los que no la toman. Sólo con esta relación no se puede afirmar que A causa B, ya que también puede ser que B cause A, debido al efecto relajante o también puede ser que se den las dos a la vez o haya un tercer factor desconocido. Existen métodos para determinar causas. El filósofo David Hume argumentaba que la causalidad no puede ser percibida y por consiguiente no se puede conocer o probar, y en su lugar tan solo se puede percibir la correlación. Sin embargo, argumentó que se puede seguir el método científico para, al menos, desechar las causas erróneas. Esto es, probar experimentalmente la veracidad de un hecho de manera rigurosa hasta encontrar un contra ejemplo o excepción.
  • Falacia de la causa simple o efecto conjuntivo o relación espuria: Esta falacia lógica de causalidad ocurre cuando se asume que existe solo una simple causa para un resultado cuando en realidad puede haber un conjunto específico o suficiente de causas que lo hayan provocado. En esta falacia lógica dos sucesos sin conexión lógica, se relacionan causal e incorrectamente debido a un tercer suceso o factor desconocido denominado factor desorientador o variable escondida que los provoca. La relación espuria da impresión de fortaleza y ligazón fuerte entre dos sucesos que es inválida cuando es examinada objetivamente. Véase la navaja de Occam que en su aplicación puede crear una relación espuria debido al desconocimiento de un factor más sencillo. Esta sobresimplificación es un caso específico de falso dilema donde otras posibilidades son ignoradas.
    • Ejemplo: Supongamos que cuando hay mayor índice de desmayos por calor suben las ventas de refrescos, muchos señalarían que los sofocos son la única causa; pero la subida de ventas pudo haber sido debida a otros factores como un mejor márketing, un mayor tiempo libre, una determinada ola de calor, una bajada de precios o la llegada del verano que sería una posible causa de las dos. En definitiva un factor o un conjunto ignorado o desconocido de factores son los que en realidad hacen que se produzca.
  • Circularidad entre causa y consecuencia: Es una falacia lógica donde la consecuencia de un determinado fenómeno es llamada a ser también la causa principal. Esto es conocido como la falacia del huevo o la gallina que hace referencia al dilema de causalidad que surge de la expresión «¿qué fue primero, la gallina o el huevo?». Puesto que el huevo y la gallina se crean recíprocamente en ciertas circunstancias la respuesta es ambigua.
    • Ejemplo: Una circularidad en causa consecuencia muy conocida se encuentra en que uno no puede obtener un trabajo sin experiencia pero no puede adquirir experiencia sin un trabajo. Es decir, la experiencia causa el trabajo pero el trabajo también causa la experiencia. La única manera de acceder a estos círculos es la transición progresiva o evolutiva definiendo de manera más amplia alguno de los factores o aceptando excepciones (o mutaciones). Si se amplía el concepto del trabajo de manera que la experiencia se pueda ganar de algo que no tenga que ser estrictamente trabajo o si se amplía el concepto de la experiencia en el que aunque se tengan conocimientos éstos no tienen nada que ver con el trabajo en cuestión o con la estricta definición de experiencia que se exige para él.
  • Petición de principio o petitio principii o fe de origen: Es una falacia que ocurre cuando la proposición a ser probada se incluye implícita o explícitamente entre las premisas de las que parte el razonamiento.
    • Ejemplo: Para probar falazmente que Pablo dice la verdad argumentaríamos del siguiente modo diciendo que: Cuando Pablo habla no miente y que por tanto, cuando está hablando Pablo, está diciendo la verdad. En una lógica bivalente, con tertium exclusum,premisa y conclusión están afirmando la misma verdad, que no miente o, lo que es lo mismo, que en ambos casos dice la verdad. La falacia es más útil cuando tiene una longitud adecuada como para hacer olvidar al receptor que la conclusión ya fue admitida como premisa.
  • falacia de las muchas preguntas o pregunta compleja con la cual, el mero hecho de responder la pregunta implica presuponer en la respuesta algo que no se quiere asumir como cierto. La finalidad de dicha falacia es que el adversario dialéctico asuma en su contestación alguna información que no se quiere conceder bien por falsa o bien porque dicha concesión perjudica gravemente la argumentación que pretende sostener. Para sortear dicha falacia lo idóneo sería no contestar, para no dar información extra que no se desea conceder al interlocutor.
    • Ejemplo:¿Todavía golpeas a tu esposa? Una respuesta negativa significará que la persona ha pegado a su esposa en un momento anterior, la afirmativa que no sólo que lo haces en la actualidad sino que lo haces desde tiempo atrás. En este tipo de preguntas se da por supuesto el hecho por el que se pregunta, y si este hecho no ha sido asumido antes por los interlocutores, la pregunta se vuelve capciosa: se incurre en la falacia de las muchas preguntas.
  • Post hoc, ergo propter hoc o post hoc o correlación coincidente o causa falsa o non sequitur (‘no le sigue’ en latín): Es una expresión latina que significa «después de esto, luego a consecuencia de esto» es un tipo de falacia que asume que si un acontecimiento sucede después de otro, el segundo es consecuencia del primero. Es verdad que una causa se produce antes de un efecto pero la falacia viene de sacar una conclusión basándose sólo en el orden de los acontecimientos. Es decir, no siempre es verdad que el primer acontecimiento produjo el segundo acontecimiento. Esta línea de razonamiento es la base para muchas creencias supersticiosas y de pensamiento mágico. Véase teoría del dominó o también cum hoc, ergo propter hoc que no hace hincapié en el orden aunque sí en la correlación de dos sucesos.
  • Non sequitur: Las razones dadas para soportar una afirmación son irrelevantes o no relacionadas.
    • Ejemplo: «Tengo miedo al agua, así que mi deporte será el puenting» o «me gusta conducir por eso me compro un Toyota». En cualquiera de los casos hacer puenting o comprarse un Toyota no depende directamente de la razón dada ya que hay muchos más coches o deportes que se han descartado sin que la razón dada sea relevante, puede producir auto-engaño por no aclarar los verdaderos motivos por los que se toma una decisión. Una manera de clarificar esta falacia es reorganizando el argumento para colocar la razón y la conclusión de manera que la incongruencia se haga evidente.
    • Ejemplo: «Me gusta conducir y por eso me compro un Toyota»; reordenando: «Me compro un Toyota porque me gusta conducir», algo que podría ser cierto o no pero que seguramente no era lo que se pretendía decir cuando se especificaba un Toyota.
    • Ejemplo: «Estamos en España así que pasaremos calor». Reordenando: «Pasaremos calor porque estamos en España».
    • Ejemplo: «Me gustan los aviones por eso hago paracaidismo». Reordenando: «Hago paracaidismo porque me gustan los aviones».
    • Ejemplo: «Ella no tiene hijos por eso no estoy de acuerdo con las prácticas educacionales de la profesora». Reordenando: «No estoy de acuerdo con la profesora porque ella no tiene hijos».
  • Falacia de la regresión o del retroceso: Es una falacia lógica en la que se asume una causa donde no existe. Este tipo de falacia es un caso especial de la falacia Post hoc, ergo propter hoc. Esta falacia se denomina de retroceso porque se produce cuando se asocia una causa simple a la desaparición o retroceso de un factor. Conduce a las supersticiones y al pensamiento mágico.
    • Ejemplo: «No somos de su agrado, cuando llegamos al bar todos se fueron».
    • También, «es culpa mía porque desde que decidí invertir en bolsa, ésta ha empezado a bajar o los precios han bajado». La explicación se encuentra en el sesgo cognitivo efecto el último evento y en la tendencia de las personas a tomar decisiones cuando las cosas están solo en la cúspide o varianza más positiva así cuando éstas se normalizan a la media asocian la causa a su acción.

 

  • Falacia del francotirador: Es una falacia lógica donde la información que no tiene relación alguna es interpretada, manipulada o maquillada hasta que ésta aparezca tener un sentido. El nombre viene de un tirador que disparó aleatoriamente varios tiros a un granero y después pintó una diana centrada en cada uno de los tiros para autoproclamarse francotirador. Tiene que ver con el sesgo cognitivo Ilusión de serie donde las personas tienden a ver patrones donde solo hay números aleatorios. Esta falacia no se aplica cuando uno tiene una predicción o una hipótesis particular antes de observar los datos. Uno podría tener una teoría de cómo debería comportarse algo o el patrón que debe seguir algo y comprobar mediante pruebas empíricas o datos que de hecho es así (método científico). Alternativamente, se pueden tomar los datos observados para construir una hipótesis tal como hace el francotirador pero luego es necesario ensayar la hipótesis con nuevos datos. Véase test de hipótesis. Uno no puede usar la misma información para construir y después ensayar o testar la hipótesis ya que incurriría en la falacia del francotirador.
  • Falacia de dirección incorrecta: Es una falacia lógica de causa en la que la causa y el efecto están intercambiados. La causa pasa a ser el efecto y viceversa. Es un tipo especial de la falacia cum hoc, ergo propter hoc o también de falso dilema.
    • Ejemplo: Las compañías de tabaco sugirieron que el cáncer hacía que la gente fumara para aliviar los dolores para explicar la alta correlación entre ellos. O también la gente de la edad media pensaba que los piojos eran buenos porque no se veían en la gente enferma. Los piojos en realidad podían provocar la enfermedad y el factor desconocido o la verdadera causa de que no se vieran cuando la enfermedad era visible fue que los piojos son muy sensibles a la fiebre o las altas temperaturas.
  • Argumentum ad consequentiam o argumento dirigido a las consecuencias: Es un argumento que concluye que una premisa (típicamente una creencia) es verdadera o falsa basándose en si esta conduce a una consecuencia deseable o indeseable. Es una falacia porque basar la veracidad de una afirmación en las consecuencias no hace a la premisa más real o verdadera. Asimismo, categorizar las consecuencias como deseables o indeseables es intrínsecamente una acción subjetiva al punto de vista del observador y no a la verdad de los hechos.
    • «El presidente no ha robado fondos del Estado, porque si lo hubiera hecho, habría perdido las elecciones».
    • «Dios debe de existir, porque si no existiera no habría moral y el mundo sería horrible».
    • «El jugador hizo todo lo que pudo, porque, si no, no hubiéramos ganado el partido».
  • Argumentum ad baculum o argumento dirigido al bastón o al mando o argumento por la fuerza: Es un argumento donde la fuerza, coacción o amenaza de fuerza es dada como justificación para una conclusión. Es un caso especial negativo del argumentum ad consequentiam. Este tipo de falacia se da en los casos en los que se duda en intervenir o no, en un conflicto. Se basa la decisión en algunos, en la consecuencia de actuar o no actuar, lo que justifica la intervención. Sin embargo, aunque estas decisiones preventivas previas, modifican forzosamente las predichas y subjetivas consecuencias, no aclaran la necesidad de actuar o no aseguran la verdad de las premisas en las mismas. El miedo a las consecuencias no puede ser el motor de ninguna decisión ni es capaz por sí mismo de hacer más veraz una posibilidad.
    • Ejemplo: «Iraq tiene armas de destrucción masiva. Como esto puede provocar una guerra muy peligrosa debe ser verdad y por tanto es necesaria una intervención».
    • Ejemplo: «Debes creer en Dios, porque si no lo haces irás al infierno». La única manera de saber la veracidad de una afirmación es basándose en los argumentos que la apoyen. La intervención, es una manera específica de resolución, es también una acción que es independiente de la veracidad de la afirmación y tiene más que ver con la inteligencia para discernir cual es la mejor manera de actuar. Esta vez si que en función de las consecuencias deseadas y a partir de las verdades encontradas, situación, entorno, etc. También es posible que se sea consciente de lo falaz de nuestra lógica y que igualmente por otras razones, egoísmo, intereses o por miedo a la simple probabilidad no nula de amenaza prefiera uno equivocarse y actuar como si estuviera seguro a esforzarse en hallar la verdad.
Mujer vistiendo el burka, vendiendo en un mercadillo.
  • Falacia del punto medio o falacia del compromiso o falacia de la moderación: se genera al asumir que la conclusión más valida o certera es la que se encuentra siempre como compromiso entre dos puntos de vista extremos. La falacia se produce porque la verdad o certeza de idoneidad se basa no en los argumentos sino en premisas subjetivas (se subjetiviza la verdad o mentira de un hecho) de qué es lo que se ha considerado como extremo y qué se considere como punto medio y que se considere que éste es siempre cierto. Es posible que lo considerado como extremo es en realidad el hecho cierto. Esta falacia viene del hecho de que con frecuencia una posición intermedia o moderada suele ser correcta.
    • Ejemplo: «Algunas personas creen que Dios es poderoso y que todo lo sabe. Otras creen que Dios no existe. Parece ser razonable aceptar un término medio. Es decir, probablemente Dios exista pero no es siempre el más poderoso, el total omnisciente, ni el más bueno» o «La Tierra está hecha principalmente de roca, y Júpiter de gases, así que Marte debe estar hecho de agua» o «Quiero vender un ordenador por 500 €, pero en eBay me ofrecen 1 €, así que deberé venderlo por 250 €» o «Las mujeres en Occidente no están obligadas a llevar burka, en cambio las mujeres en Oriente están obligadas a llevar el burka, por tanto, las mujeres de todo el mundo se las debería obligar a llevar pañuelo». Esta conclusión es falaz.
  • Recurso de probabilidad o apelar a la probabilidad: Es una falacia lógica que asume que porque algo es posible o probable, es inevitable que pase. Esta falacia es usada para provocar y promover la paranoia.
    • Ejemplo: «Hay muchos hackers que usan Internet. Por consiguiente, si usas internet sin un cortafuegos es inevitable que tarde o temprano seas intervenido». La idea lógica que hay detrás de esta falacia es que ya que la probabilidad es muy alta es mejor actuar como si esta fuera verdad. El hecho de que algo sea probable de ocurrir no es un argumento para atestiguar o verificar que ha pasado.

[editar] Falacias informales o paralogismos

  • Conclusión irrelevante o ignoratio elenchi o refutación ignorante o eludir la cuestión: Es la falacia lógica de presentar un argumento que puede ser por sí mismo válido, pero que prueba o soporta una proposición diferente a que la que debería apoyar. Aristóteles creía que todas las falacias lógicas podían ser reducidas a ignoratio elenchi. También en algunos casos estas conclusiones irrelevantes son intentos deliberados por parte de manipuladores, expertos en falacias lógicas, de cambiar el asunto de la conversación.
    • Ejemplo: Pablo es un buen deportista y debe ganar la copa. Después de todo, es un buen tipo, ha donado mucho dinero y es miembro de una ONG. Las donaciones o preferencias solidarias no tienen que ver con el merecimiento deportivo de una copa. Tu quoque (‘tú también’ en latín), es un tipo específico de ignoratio elenchi porque se basa en que la premisa o consejo presentado por una persona es falsa porque esta misma persona no la sigue.
    • Ejemplo: «Thomas Jefferson decía que la esclavitud estaba mal. Sin embargo, él mismo tenía esclavos. Por lo tanto se deduce que su afirmación es errónea y la esclavitud debe estar bien».
      Falacia del hombre de paja. El error del hombre de paja o espantapájaros. Un objetivo/argumento, fácil a abatir sustituye al verdadero.
  • Argumentum ad hominem o argumento dirigido al hombre: Consiste en replicar al argumento atacando o dirigiéndose a la persona que realiza el argumento más que a la sustancia del argumento. Tu quoque en el que se desvelan trapos sucios suele ser un mecanismo.
    • Ejemplo: Dices que este hombre es inocente pero no puedes ser creíble porque tú también eres un criminal.
  • Falacia del hombre de paja o argumentum ad logicam: Es una falacia lógica basada en la confusión de la posición del oponente. Generar un «hombre de paja» es crear una posición fácil de refutar y luego atribuir esa posición al oponente para destrozarlo. En realidad el argumento real del oponente no es refutado sino el argumento ficticio que se ha creado. El nombre viene de los hombres de paja que se usan para entrenar en el combate y que son fáciles de abatir. Es decir, se atacan los flecos o posibles malinterpretaciones que se puedan hacer de la premisa. Ejemplo: Pedro: «Pienso que los niños no deberían correr por calles con mucho tráfico». Juan aprovecha y crea una posición clara de ataque: «Yo pienso que sería estúpido encerrar a los niños todo el día sin respirar aire limpio». De esta manera, Juan puede atacar una posición radical y fácil que Pedro nunca quiso dar a entender. La única manera de evitar el hombre de paja es que Pedro lo destruya antes que Juan o poner en evidencia la intención de Juan de crearlo para confundir.
  • Argumentum ad silentio o argumento dirigido al silencio: Consiste en considerar que el silencio de un ponente o interlocutor sobre un asunto X prueba o sugiere que el ponente es un ignorante sobre X o tiene un motivo para mantenerse en silencio respecto a X. En relación con esta falacia, es necesario hacer referencia a la doctrina jurídico-procesal llamada «de los actos propios», por la cual, en una de sus aplicaciones más frecuentes, si una de las partes en un proceso no alega cierto hecho, dato, prueba o argumento disponiendo de trámite para hacerlo, se presumirá que carece del mismo. Por tanto, aunque lógicamente el argumentum a silentio o ex silentio es una falacia, porque el silencio de un interlocutor no puede tomarse como prueba de certidumbre de lo dicho por un interlocutor contrario, en el terreno de la pura retórica puede ser un indicio de falta de argumentos o de falta de capacidad para contrarrestar dialécticamente los argumentos expuestos por la adversa. Esta presunción se realiza en el terreno jurídico por ser este un terreno subjetivo marcado por leyes que están hechas para que la mayoría pueda quedar satisfecha. Y esto es así porque la mayoría posee el prejuicio de que el silencio de un interlocutor implica la falta de argumentos o un motivo particular para tenerlo y también porque el que rompe el estado de normalidad tiene la obligación de probar con argumentos las acusaciones. Véase Falacia de eludir la carga de la prueba.
  • Hipótesis ad hoc: en filosofía y ciencia, ad hoc significa con frecuencia la adición de hipótesis corolarias o ajustes a una teoría filosófica o científica para salvar la teoría de ser rechazada o refutada por sus posibles anomalías y problemas que no fueron anticipados en la manera original. Véase también falacia del francotirador en el que las consecuencias o el orden lógico que se supone debería preverse se desarrolla después de ver los datos. Filósofos y científicos se comportan de manera escéptica ante las teorías que continuamente y de manera poco elegante realizan ajustes ad hoc o hipótesis ad hoc ya que estas son con frecuencia características de teorías seudocientíficas. Gran parte del trabajo científico recae en la modificación de las teorías o hipótesis ya existentes, pero estas modificaciones se distinguen de las modificaciones ad hoc en que los nuevos cambios proponen a su vez nuevos medios o contraejemplos para ser falsificados o refutados. Es decir, la teoría tendría que cumplir con las nuevas contenciones junto con las anteriores.
  • Falacia por asociación: Es un tipo de falacia lógica que sostiene que las cualidades de uno son intrínsecamente o esencialmente cualidades de otro simplemente por asociación. Las falacias por asociación son un caso especial de ignoratio elenchi o red herring en inglés en relación a que el argumento de réplica no tiene que ver con el tema o asunto tratado sino que el asunto es deliberadamente modificado para divergir en un tema mejor defendible. Algunos ejemplos de falacia por asociación son: «Algunas obras caritativas son fraudes. Por consiguiente todas las obras caritativas son fraudulentas» o «Bush quiere invadir Iraq. Bush es un republicano. Por consiguiente todos los que apoyan la invasión de Iraq son republicanos».
  • Ad ignorantiam o argumento dirigido a la ignorancia: Es una falacia lógica la cual afirma que una premisa es verdadera sólo porque no ha sido probada como falsa o que la premisa es falsa porque no ha sido probada como verdadera. Esto es una falacia porque la veracidad o falsedad de cualquier afirmación es independiente de nuestro conocimiento. Si bien es cierto, sin conocimiento o prueba no se puede ejecutar ninguna acción sin riesgo. Es decir, esta falacia produce que si uno, es decir, subjetivamente o debido a nuestro propio conocimiento encuentra una premisa increíble o poco probable, la premisa puede ser asumida como no verdadera o alternativamente que otra premisa más conocida o preferida pero no probada es la verdadera o la más probable. Con esto, lo que se hace es subjetivizar el estado de verdad o falsedad de las cosas al propio conocimiento o familiaridad del individuo con estas, algo que evidentemente es erróneo. Véase también el modelo de navaja de Occam es decir, un argumento dirigido a la complejidad, que aunque falaz, estrictamente, es un método que inevitablemente a falta de pruebas se sigue usando porque guarda una verdad implícita: en igualdad de condiciones, la sencillez es preferible a la complejidad.
  • Falacia del efecto dominó o pendiente deslizante: Es un tipo de falacia lógica que argumenta que si se realiza un determinado movimiento o acción en una determinada dirección esta generará un cascada de eventos uno tras otros en la misma dirección. Esta falacia está basada en las falacias de asociación, las falacias de causa simple, las falacias post hoc, ergo propter hoc y sobre todo en la falacia de recurso de probabilidad que conduce a la paranoia. La falacia consiste en que una vez realizado el primer movimiento en una dirección se continuará inevitablemente en la misma dirección, algo que es probable pero que no debe considerarse cierto. Para evitar caer en la falacia se deben aportar argumentos para la conexión entre los sucesos y tener en cuenta que a medida que se desencadenan más sucesos la probabilidad de que estos ocurran es siempre menor. Este tipo de argumentación es beneficiosa en demagogia ya que aprovechando el sesgo de falsa vivencia consigue despertar la paranoia y el miedo en los receptores. La probabilidad de un suceso no implica su certeza. Esta falacia se usa también con la falacia del hombre de paja de la siguiente manera: 1) A sucede; 2) B inevitablemente sucederá (se aplica la falacia del efecto dominó); 3) B es un suceso detestable (es un suceso fácilmente defendible al que el locutor no quería llegar); 4) por consiguiente A también es detestable (consecución de la falacia del hombre de paja. La conexión entre el suceso A y suceso B puede ser falaz o no serlo y depende de si se aportan suficientes argumentos. Véase también teoría del dominó donde se explica que un argumento independiente es necesario para explicar por qué un principio similar al domino es aplicable a las propias circunstancias.
  • Recurrir a las emociones o dirigido a las emociones: en esta falacia el locutor trata de manipular las emociones del receptor, más que usar argumentos válidos, para demostrar la validez o invalidez de los argumentos del contrario. Dentro de esta falacia se encuentran otras como, recurrir a las consecuencias, recurrir al miedo, recurrir a la culpa, recurrir al ridículo, recurso del victimismo y demás falacias en las que las emociones o estados subjetivos de uno o varios individuos se usan como argumento para demostrar la veracidad o falsedad de una aseveración. Especial atención para el recurso del victimismo en el que se mezclan el Argumentum ad hominemataques o argumentos sobre las personas y una apelación a las emociones. Ejemplos:
Falacia del recurso del victimismo: Pedro: X pesa 50 Kg. Juan: Eso no es cierto, X pesa 100 Kg, lo pesé hoy con la báscula. Pedro: Esta persona siempre me está atacando afirmando que miento. Trata de imponer su punto de vista, es injusto. Haga el favor de disculparse, mi opinión merece ser respetada y no puede imponer la suya sobre la de los demás. Es usted 'un dictador. Aunque, lo predicado por Pedro pudiera ser cierto no tiene nada que ver con la verdad o falsedad del argumento, pero permite desviar la atención de los datos y verdaderos argumentos. La mejor forma de evitar la falacia es poner en evidencia que el tema tratado y el recurso de victimismo son temas diferentes y que deben tratarse por separado. Falacia de recurrir a las consecuencias: El futbolista hizo todo lo que pudo, de otra manera no se hubiera ganado; donde se recurre a la consecuencia positiva o a la felicidad del momento para ganar aceptación. Falacia de recurrir al miedo o argumentum ad metam o argumentum in terrorem: Si no te gradúas siempre serás pobre o Dios existe y si no crees en él, arderás en el infierno o si no actuamos ahora después será demasiado tarde. Ninguno da argumentos sobre su premisa principal tan solo se limitan a presentar una ilusión negativa o falsa vivencia que afecte a tus emociones.
Caricatura de Charles Darwin como un simio, en la revista Hornet. Se puede observar que lo representaban con características propias de la rama de los simios, como manera de burla a su observación de la evolución del simio al hombre actual. Recurso al ridículo o también a la «falacia ad hóminem».
  • Recurrir al ridículo: Esta falacia se parece a la falacia «recurrir a las emociones» porque se presentan los argumentos del oponente de modo que estos parezcan ridículos o irrisorios. Con frecuencia esta falacia es una extensión de un intento por crear una falacia de hombre de paja del argumento actual. Ejemplo: «Si la teoría de la evolución fuera cierta, ¡sería decir que tu abuelo era un gorila!». O este otro ejemplo:
Pedro: Deberían subir el precio de las balas.Juan: Claro, al irte de caza ¿te imaginas pedir un crédito para poder comprarlas?

En esta falacia se ridiculiza el argumento. No confundir con la falacia de argumentum ad hominem en el que se ataca a la persona para derrumbar su argumento. Tampoco confundir con reductio ad absurdum (reducción al absurdo) o prueba por contradicción que correctamente construida no es una falacia sino un argumento lógico que además es usado en matemáticas. Reducción al absurdo significa encontrar una excepción de alguna premisa que de manera consensuada o probada la haga falsa o absurda. Ejemplo:

Pedro: No vayas a la fiesta.María: ¿Por qué no?Pedro: Porque hay chicos que se aprovechan.María: Ok, entonces tampoco iré a la universidad, puesto que también hay chicos aprovechados.

1) Todas las creencias tienen igual validez; 2) yo creo que todas no tienen validez; 3) como tú dices que todas tienen validez y la mía es una creencia, ésta también debe ser válida, por lo que te contradices.

  • Argumentum ad populum o «dirigido a las personas» o «dirigido al número de personas» o «dirigido a la mayoría» o «tiranía de la mayoría»: Es un argumento falaz que concluye que una proposición debe ser verdadera porque muchas personas lo creen así. Es decir, recurre a que «si muchas personas lo creen así, entonces será así». En ética el argumento falaz sería «si muchos lo encuentran aceptable, entonces es aceptable». Esta falacia hace uso del prejuicio efecto carro ganador. Esta falacia es un tipo de falacia genética o basada en el origen de las cosas. Es una falacia porque el mero hecho de que una creencia esté ampliamente extendida no soporta o no la hace necesariamente correcta o verdadera. Esto se basa en que si una opinión individual puede ser incorrecta, entonces la opinión sostenida por muchas personas también puede serla. La veracidad o falsedad de una afirmación es independiente o no reside en el número de personas que creen en ella. Esta falacia se usa mucho en publicidad. Ejemplo: «50 millones de fans no pueden estar equivocados» o «la marca X es la marca líder en Europa, por eso deberías comprar productos de esta marca» o «la mayor parte de la gente del planeta cree en algún dios, y no se conocen entre sí, eso no puede ser coincidencia: Dios debe existir» o «los ecologistas dicen que el calentamiento global está sucediendo porque la mayoría de los científicos dicen y lo creen así». Esto es una afirmación falaz, sin embargo, la ciencia trabaja sobre la evidencia no el voto popular, así es apropiado fijarse más en las evidencias que se presentan más que en el número de personas que lo afirman o lo niegan. Esto lleva a que los resultados en democracia no pueden catalogarse como buenos o malos por el número de votantes tan solo se puede afirmar que el resultado es el que el mayor número de personas quiere y eso en democracia debe ser suficiente. Votar por una solución o voto plural como método para saber si una afirmación es cierta o falsa es falaz e incorrecto. Un espectador de un juicio que observa una votación y no los argumentos no puede deducir después de la votación o por el resultado si lo votado es cierto o no. Esto es así porque la votación pudo haberse llevado a cabo a través de los prejuicios y no a través de los argumentos. De igual manera si la lógica es llevada solo a través de argumentos sólidos no sería necesaria la votación. Tanto la democracia como los juicios no obvian esto sino que simplemente hacen la falacia irrelevante definiendo leyes que son subjetivas más que objetivas. Es decir, no se trata de hallar la verdad o lo mejor posible sino de encontrar una solución que agrade a la mayoría. En los juicios por votación existe para evitar, en lo posible, un efecto carro ganador, la presunción de inocencia y además la idea de que la simple posibilidad, suposiciones o pruebas circunstanciales no deben ser tenidas en cuenta por el jurado. Existen excepciones como en etiqueta y protocolo. Estas solo dependen de la aceptación mayoritaria de estos, es decir, son totalmente subjetivos al número así que un argumento ad populum no es falaz en para estos casos. Ejemplo: En Rusia la mayoría piensa que es cortés entre hombres besarse en cada encuentro. Por consiguiente, es cortés para los hombres hacerlo en Rusia. Otra excepción es cuando el argumentum ad pópulum implica implícitamente un argumento «de seguridad» por convención pero no se centra en si es mejor o peor el sistema. Ejemplo: Todos conducen por la derecha. Por tanto, para no tener problemas deberías conducir por la derecha.
  • Argumentum ad náuseam: Es un tipo de falacia dirigida a las emociones en el que las personas creen que una afirmación es más probable de ser cierta o más probable de ser aceptada como verdad cuanto más veces ha sido oída. Esta falacia está dirigida a las emociones porque el hastío o ad náuseam que se genera subjetivamente o en cada persona por la repetición de la afirmación es tal que puede hacer cambiar el concepto de ésta sin llegar a escuchar ningún argumento válido. De esta manera, un argumentum ad náuseam es aquel que emplea repetición constante de una afirmación hasta que los receptores se convencen de esta. Este tipo de técnica falaz es usada mucho en política donde sin emplear argumentos, pruebas o evidencias de un hecho se repite una y otra vez la misma afirmación hasta la conversión. Sin embargo, por mucho más que se repita o más esfuerzo se ponga en hacerlo, esto no hace a la afirmación más real o verdadera. Esta falacia viene de la falsa creencia de que si alguien se molesta o dedica tanta energía para la repetición de un mensaje es porque éste debe ser más veraz que otro que no se molesta o puede rebatirlo. Véase efecto del carro ganador y sesgo de la debilidad y fortaleza. 
  • Argumentum ad verecundiam o apelar a la autoridad o argumento dirigido a la autoridad: Esta falacia lógica consiste en basar la veracidad o falsedad de una afirmación en la autoridad, fama, prestigio, conocimiento o posición de la persona que la realiza. Un tipo especial de esta falacia es la falacia argumentum ad crumenam donde se considera más veraz una afirmación porque la persona que la realiza es rica o por el contrario en argumentum ad lazarum porque el pobre o de menor clase quien la realiza. La veracidad de un hecho o afirmación no depende, en último estado, de la persona que la realice sino de las pruebas, evidencias o argumentos que se presenten. Esta falacia también puede considerarse una variante del argumentum ad hominem ya que también subjetiviza la veracidad o falsedad de una afirmación en la calificación de un individuo. Sin embargo, al igual que a través de la experimentación se tratan de encontrar excepciones y si no se encuentran se puede considerar una teoría como verdadera, igualmente se puede hacer con las autoridades. Un argumento que apela a la autoridad y no falaz sino lógico en función de sus premisas sería: 1) A realiza una afirmación B 2) A nunca está confundido, equivocado o deshonesto 3) por lo tanto la afirmación, evidencia o prueba B debe ser tomada en consideración que no como cierta. Tanto como la premisa 2 sea cierta su conclusión también lo será. Así apelar a una autoridad puede ser lógicamente correcto mientras haya sido suficientemente probada su autoridad y no se hayan encontrado excepciones. Esto no quiere decir que la afirmación sea cierta y no se encuentre una excepción pero esto es algo que es inevitablemente y energéticamente hablando no puede evitarse por el número de pruebas y test que deberían hacer para tomar decisiones. Ejemplos falaces son los siguientes: «esa afirmación es verdad, porque lo he visto en televisión» o «esto debe ser verdad porque aparece en Wikipedia» o «lo dice la revista científica Nature, por consiguiente debe ser cierto». En todos estos casos si no se conocen o se ha experimentado con las fuentes se genera un ipse dixit.
Ejemplos de argumentos haciendo uso de la falacia argumenum ad consecuentiam.
  • Recurrir a la tradición o argumentum ad antiquitatem: Es una falacia lógica típica en la que una tesis es proclamada como correcta basándose en que ésta ha sido tradicionalmente considerada correcta durante mucho tiempo. En definitiva, «esto es correcto porque siempre se ha hecho de esta manera». Este argumento hace dos suposiciones: 1) que la antigua manera de pensar fue probada como correcta cuando se introdujo (lo cual puede ser falso, ya que la tradición puede estar basada en fundamentos incorrectos); 2) las razones que probaron este argumento en el pasado son actualmente vigentes para hoy. Si las circunstancias han cambiado esto puede ser falso. Por otro lado, esta falacia también asume que mantener el statu quó es preferible o deseable ante la posibilidad de un cambio, lo cual puede ser también incorrecto. Ejemplo: «En Navidad siempre hemos traído a casa árboles arrancados del bosque, ¿por qué ahora tendremos que comprar uno de plástico?»
  • Falacia de las muchas preguntas o pregunta compleja o plurium interrogationum (‘de muchas preguntas’ en latín): es una falacia formal que es realizada cuando alguien hace una pregunta que presupone algo que todavía no ha sido probado o aceptado por todas las personas envueltas. Esta falacia es con frecuencia usada retóricamente para dar a entender la presunción o conocimiento de la respuesta a la pregunta por parte del que la realiza. Ejemplo: «¿Sigues saliendo a comer con tu mujer?». La respuesta tanto afirmativa como negativa admitiría que la persona tiene mujer y que al menos antes salía a comer con ella. Estos hechos son presupuestos por la pregunta. Se trata de una falacia porque se asume la verdad o se presuponen algunos hechos a la hora de hacer la pregunta compleja. Esto no quiere decir que no sean ciertos pero si que no deben creerse, por los demás oyentes, como ciertos hasta no recibir la respuesta. Para evitar estas asunciones lo mejor es no responder la pregunta ya que no se dará ninguna información extra. Para evitar hacerlo se puede responder con otra pregunta que apunte al porqué de las asunciones o denotar o mostrar que la pregunta está envenenada y ha presupuesto algunos hechos. Si no es posible evitar responder entonces la respuesta debe ser completa y negar las presunciones.
  • Dos errores hacen un acierto: Es una falacia lógica que ocurre cuando se asume que si un error es cometido, otro error podrá cancelarlo. La falsedad o equivocación en un comentario o acción no hace más necesario, loable o racionalmente prudencial realizar otro acto equivocado en represalia. Este tipo de falacia se reproduce en la ley de talión o en el ojo por ojo. Es debida a varios sesgos como sesgo de simetría, fenómeno del mundo justo. El problema no reside en saber qué se considera error o si se considera un error y un acierto la represalia. La falacia no está en la definición de las dos acciones iniciales sino en considerar que el resultado está definitivamente, por cancelación, ligado a un acierto o a un error. La idea de que un error es cancelado por otro viene de la semejanza o ilusión de serie que existe con las leyes físicas donde una fuerza en una dirección genera otra fuerza simétrica, de igual magnitud, pero en dirección opuesta. Sin embargo, la ley no se pronuncia sobre el acierto de la fuerza en un sentido y del otro, es decir, no se pronuncia sobre la idoneidad o finalidad de este comportamiento. Es decir, en física esto no se puede cambiar pero en los comportamientos sí y si una reacción diferente conduce a una mejor consecución de acontecimientos, esta debería tomarse. De esta manera muchos pueden encontrar argumentos para justificar que en defensa propia uno puede responder con violencia a la violencia pero no podrán ligar un resultado positivo debido solo a una cancelación de efectos. Es más, en la guerra fría, la amenaza nuclear en represalia a otra amenaza nuclear fue usada y aunque evitó la guerra creó una escalada armamentística. Es decir, ligar el resultado a un acierto debe hacerse con otros argumentos más que la pura cancelación de dos efectos nocivos. De otra manera, se pueden entrar en ciclos de violencia, acumulación de armas, escalada de desconfianza, y otros errores en incremento, cuando la otra parte usa la misma lógica. Ejemplo:
Juan: Llamé a mi jefe y le llamé idiota. Puedo volver a llamar y llamarle idiota pero diciendo que soy Susana». Aunque el segundo hecho perjudicial puede aparentemente cancelar mi primer error no se puede asumir un acierto y salir sin problemas del atolladero. Se podría hacer lo correcto y disculparse y quizás el resultado hubiera sido también acertado. La cuestión es que tanto lo uno como lo otro no liga a un resultado si no hay argumentos que lo apoyen como la personalidad de tu jefe, confianza con él y otros argumentos.
  • Falacia del costo irrecuperable o falacia de la concordia: Esta falacia se produce cuando alguien realiza una inversión que parece ser no rentable y razona de la siguiente manera: «No puedo parar ahora, de otra manera lo que he invertido hasta el momento se perderá». Esto es verdad, por supuesto, pero irrelevante para la decisión de si uno debe continuar invirtiendo en el proyecto. Es decir, los argumentos para seguir invirtiendo en el proyecto no se deben basar en el miedo a la pérdida de lo invertido sino en las expectativas de funcionamiento del proyecto ambas cosas totalmente independientes. Si no hay esperanza de ningún éxito para la inversión, entonces, el hecho de que uno haya ya metido un montón de dinero y esfuerzo no justifica tener que seguir perdiéndolo para no afrontar el error inicial. Esto se da en las personas que no saben o pueden claudicar, por el prejuicio existente de que si se pone toda la energía en algo serán capaces de vencerlo. Sin embargo, siempre puede haber un factor desconocido o variable desconocida que podría llevarles al fracaso indefinidamente o irremediablemente. Esta falacia se constata en que estas personas creen ser capaces siempre de aprender o hallar este factor cuando la operación lógica sería parar y una vez aprendido comenzar. Continuar invirtiendo en un proyecto que no funciona no depende de lo invertido sino de la esperanza o estimación de éxito justificada o de la importancia del mismo para otros factores independientemente de los resultados a corto plazo. Ejemplo: Todos sabemos que vamos a morir. Luchar por la supervivencia tiene sentido aunque inevitablemente se fracase. La supervivencia es importante para otros objetivos secundarios como la reproducción, la superación, aprendizaje y otros valores que subjetivamente consideremos secundarios y que no tengan que ver necesariamente con la propia supervivencia pero que dependan directamente de ésta. Ejemplo: Supongamos que una relación no funciona y que es evidente que dicha relación es considerada temporal. La inversión en esta relación podría estar justificada por los objetivos o beneficios secundarios que pueda generar. El límite o punto en el que es considerado necesario abandonar puede estar para algunos en el momento en el que se debe poner más energía de la necesaria para obtener los beneficios por otros cauces. O en una situación optimista cuando los beneficios laterales disminuyan a partir de cierta barrera considerada mínima para el proyecto. La cuestión es que muchos caen en la falacia y persisten en una relación o proyecto incluso cuando no reporta beneficios laterales o secundarios por el simple hecho o razón de que ya han invertido toda su vida o todos sus fondos en él y ésta fuera una razón lógica para seguir haciéndolo.
  • Falacia de acentuación: Se trata de una de las falacias lingüísticas reconocidas por Aristóteles y que era usada por el Oráculo de Delfos. La falacia se construye al realizar una proposición que contiene una parte afirmando o concordando con un tema y otra parte con una objeción o condición. En función de dónde se aplique la fuerza de acentuación se denotará más o menos importancia en un sentido u otro. De esta manera se puede crear una ambigüedad en el sentido de la interpretación. Este tipo de engaño o falacia así como las verdades a medias se da con mucha frecuencia en política ya que permite al político retractarse de lo dicho si las cosas salen mal. Ejemplo: Un periodista le pregunta a un miembro del congreso acerca de si éste está de acuerdo con el nuevo sistema de misiles del presidente; el congresista responde: «Estoy a favor de un sistema de defensa de misiles que efectivamente defienda a nuestro país». Si le da énfasis a la palabra favor estará de acuerdo con el presidente, pero si da énfasis a las palabras que efectivamente defienda significará que no se está de acuerdo con el sistema de misiles del presidente. Ejemplo: «Me gustas mucho, cuando estás de buen humor» o «estoy de acuerdo con un sistema de votación que sea justo y claro».
  • Anfibología: Es un tipo de falacia del lenguaje que se da cuando se emplean frases o palabras con más de una interpretación, o cuyo significado puede cambiar en función de si se insertan comas o pausas. También fueron usadas por el Oráculo de Delfos. Ejemplo: «Persas, quedaos en vuestra casa». Tiene dos interpretaciones: «Persas, quedaos en Persia» o «¡Persas! Griegos, quedaos en Grecia». Ejemplo: «Si luchas con puntas de plata, un gran reino será vencido». Pero, ¿qué reino será vencido, el enemigo o el propio?
  • Argumento del precio o recurrir al dinero: La falacia del argumento del precio se produce cuando se supone que si algo cuesta una gran cantidad de dinero, entonces debe ser mejor. También se da si se supone que si alguien tiene una gran cantidad de dinero entonces será también una mejor persona en alguna otra faceta. Véase efecto halo y argumentum ad crumenaem. Ejemplo: «Puede ser que este producto tenga mejores características, pero este otro es más caro y elitista, así que debe ser mejor» o «el vino de la cosecha del 45 es increíble, cada botella cuesta 3000 euros; ¡no lo puedes ni comparar con el ganador de este año!».
  • Evadir la conversación o «ignoratio elenchi de conversación» o eludir la cuestión: Es un razonamiento que se supone tendrá que responder a un tema determinado pero en lugar de hacerlo, narra o explica aspectos distintos. La mejor manera de hacerlo es explicar y narrar extensamente algo anexo a la respuesta pero que el espectador viera con buenos ojos. Es decir, si la pregunta es sobre una supuesta corrupción fiscal. La respuesta sería hablar sobre lo buena persona, eficiente, honrada que es tu familia en casa. Hablar luego de la honradez o de la eficiencia de tus colaboradores. Así sin responder directamente a la pregunta permites que el espectador suponga por asociación y caiga en la falacia de asociación. Este tipo de respuesta se da mucho en política y debates y es muy usual y al mismo tiempo muy importante. Es una técnica sencilla pero poderosa si se sabe lo que el público desea escuchar. Cuando se describe algo, también se pueden insertar comandos u órdenes que según la programación neurolingüística permiten que la gente haga o piense del modo que se desee. Cuando se describe algo positivo no de uno mismo sino de otra persona, por asociación neurolingüística esas mismas palabras son interpretadas sobre ti o sobre el propio receptor. De esta manera si se describen situaciones positivas es posible programar a los oyentes para que en realidad crean que tú las posees. Ejemplo: «¿Ganarán el partido mañana?». Respuesta: «Hemos trabajado duro, el equipo está al 100% y luchará hasta el final para conseguir lo mejor de ellos. Esta temporada hemos ganado casi todos los partidos, mañana será un día importante y los chicos lo saben». Ejemplo: «¿Te gusta María?». Respuesta: «Ella es alguien especial, siempre estoy con ella y lo pasamos bien. Es una buena chica y puedo confiar en ella, es mucho de lo que siempre he buscado en una mujer». Ejemplo: «¿Qué prefieres, amor o sexo?» Respuesta: «El amor es algo muy importante en la vida de todos, me gusta amar y ser amado, y con el sexo igual. Nadie puede vivir sin amor. Por fortuna, tengo la suerte de ser amado por una familia que me aprecia y que me quiere y de tener muchos amigos».
  • Pensamiento de grupo: Una persona comete la falacia de pensamiento de grupo o de pensamiento gremial si la persona usa su orgullo de miembro o de pertenecer a un grupo como razón para apoyar la política del grupo. Si lo que el grupo piensa es esto, entonces eso es suficientemente bueno para mi y es lo que debería pensar también yo. El patriotismo o en sentimiento nacionalista es una versión fuerte de esta falacia. Ejemplo: «Soy de EE. UU., así que todo lo que haga mi país en Iraq es bueno, porque EE. UU. es un país libre y avanzado» o «debemos apoyar al gobierno en esta medida porque él siempre hace lo mejor para sus ciudadanos» o «que todo el mundo sepa que lo que hacemos es lo mejor porque pertenecemos a la mejor cadena de restaurantes». «Soy mujer, así que todo lo que digan las feministas es bueno, y todo lo que digan los hombres es malo».
  • Falacia de eludir la carga de prueba: Consiste en asumir que algo es verdad o mentira mediante el simple hecho de no aportar razones que fundamenten la conclusión (silencio), en negarse o en pretender que las aporte el oponente. La expresión carga de la prueba procede del campo jurídico y se expresa en el brocardo: probat qüi dicit non qüi negat (‘debes probar lo que dices, no lo que niegas’), es decir que quien sostiene algo debe probarlo más allá de toda duda razonable. Expresión máxima de esta falacia es la sordera mental de quien se niega a razonar. Como decía fray Luis de León: «Dice y no da razón de lo que dice». Ejemplo: «Sobre la cuestión del divorcio no quiero ni oír hablar. Como te he dicho, creo que el vínculo del matrimonio es indivisible y punto» o «no escuches lo que dice, es todo manipulación informativa». (Para saber si es manipulación se deben escuchar los argumentos de ambas partes y comprobar si son ciertos. Para sostener una afirmación o para disponer más carga en un sentido o en otro es necesario disponer de la información o presentar pruebas de ello, por tanto, nunca se debe eludir la carga de prueba. Véase Pensamiento crítico.
Ir arriba

[editar] Tipos de falacias no formales

La siguiente lista contiene tipos de falacias, aunque no es exhaustiva.

  • ad hominem abusivo (o argumentum ad personam)
  • ad hominem circunstancial (o ad hominem circumstantiae)
  • ad hominem tu quoque (o argumento del "tú también")

[editar] Véase también

[editar] Notas y referencias

  1. Hansen, Hans Vilhelm (2002). «The Straw Thing of Fallacy Theory: The Standard Definition of 'Fallacy'». Argumentation 16 (2):  pp. 133-155. 
  2. De hecho, inferir que la conclusión de un razonamiento es falsa porque el razonamiento es falaz es en sí mismo una falacia, conocida como argumento ad logicam.

[editar] Bibliografía adicional

  • Copi, Irving, Introducción a la lógica, Eudeba, Buenos Aires, 1969.
  • Juan Manuel Comesaña, Lógica informal, falacias y argumentos filosóficos, Eudeba, Buenos Aires, 2001.
  • Pablo da Silveira, Cómo ganar discusiones (o al menos cómo evitar perderlas), Taurus, Buenos Aires, 2004.
  • Aristoteles, On Sophistical Refutations - De Sophistici Elenchi.
  • Ockham, William of, Summa of Logic (ca. 1323), parte 3.4.
  • Buridan, John, Súmmulae de dialéctica, libro 7.
  • Bacon, Francis, fly.hiwaay.net (Francis Bacon, la doctrina de los ídolos en el Novum Órganum Scientiarum, aforismos relativos a The Interpretation of Nature and the Kingdom of Man, 23 ff)
  • Arthur Schopenhauer, The Art of Controversy.
  • Mill, John Stuart, A System of Logic LA.UTexas.edu/Research/Poltheory/Mill/SOL
  • Raciocinative and Inductive, Book 5, Chapter 7, Fallacies of Confusion
  • Hamblin, C. L., Fallacies, Methuen, London, 1970.
  • Fischer, D. H., Historians’ Fallacies: Toward a Logic of Historical Thought, Harper Torchbooks, 1970.
  • Walton, Douglas N., Informal logic: A handbook for critical argumentation, Cambridge University Press, 1989.
  • Walton, Douglas N., The place of emotion in Argument, The Pennsylvania State University Press, 1992.
  • Van Eemeren, F. H., y R. Grootendorst, Argumentation, Communication and Fallacies: A Pragma-Dialectical Perspective, Lawrence Erlbaum and Associates, 1992.

[editar] Enlaces externos

En español:

En inglés:

02/11/2010 15:16 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿SON LAS MATEMÁTICAS LÓGICA PROPOSICIONAL?. En lógica(matemática), la lógica proposicional es un sistema formal diseñado para analizar ciertos tipos de argumentos. En lógica proposicional, las fórmulas representan proposiciones y las conectivas lógicas son operaciones sobre dichas fórmulas, capaces de formar otras fórmulas de mayor complejidad.[1] Como otros sistemas lógicos, la lógica proposicional intenta esclarecer nuestra comprensión de la noción de consecuencia lógica para el rango de argumentos que analiza.

Lógica proposicional

De Wikipedia, la enciclopedia libre

En lógica(matemática), la lógica proposicional es un sistema formal diseñado para analizar ciertos tipos de argumentos. En lógica proposicional, las fórmulas representan proposiciones y las conectivas lógicas son operaciones sobre dichas fórmulas, capaces de formar otras fórmulas de mayor complejidad.[1] Como otros sistemas lógicos, la lógica proposicional intenta esclarecer nuestra comprensión de la noción de consecuencia lógica para el rango de argumentos que analiza.

Contenido

[ocultar]

[editar] Introducción

Considérese el siguiente argumento:

  1. Mañana es miércoles o mañana es jueves.
  2. Mañana no es jueves.
  3. Por lo tanto, mañana es miércoles.

Es un argumento válido. Quiere decir que es imposible que las premisas sean verdaderas y la conclusión falsa. Esto no quiere decir que la conclusión sea verdadera. Si las premisas son falsas, entonces la conclusión también podría serlo. Pero si las premisas son verdaderas, entonces la conclusión también lo es. La validez de este argumento no se debe al significado de las expresiones "mañana es miércoles" y "mañana es jueves", porque éstas podrían cambiarse por otras y el argumento permanecer válido. Por ejemplo:

  1. Está soleado o está nublado.
  2. No está nublado.
  3. Por lo tanto, está soleado.

En cambio, la validez de estos dos argumentos depende del significado de las expresiones "o" y "no". Si alguna de estas expresiones se cambiara por otra, entonces podría ser que los argumentos dejaran de ser válidos. Por ejemplo:

  1. Ni está soleado ni está nublado.
  2. No está nublado.
  3. Por lo tanto, está soleado.

Las expresiones de las que depende la validez de los argumentos se llaman conectivas lógicas. La lógica proposicional estudia el comportamiento de una variedad de estas expresiones. En cuanto a las expresiones como "está nublado" o "mañana es jueves", lo único que importa de ellas es que tengan un valor de verdad. Es por esto que se las reemplaza por simples letras, cuya intención es simbolizar una expresión con valor de verdad cualquiera. A estas letras se las llama variables proposicionales, y en general se toman del alfabeto latino, empezando por la letra p, luego q, r, s, etc. Así, los dos primeros argumentos de esta sección podrían reescribirse así:

  1. p o q
  2. No q
  3. Por lo tanto, p

Y el tercer argumento, a pesar de no ser válido, puede reescribirse así:

  1. Ni p ni q
  2. No q
  3. Por lo tanto, p

[editar] Conectivas lógicas

Artículo principal: Conectiva lógica

A continuación hay una tabla que despliega todas las conectivas lógicas que ocupan a la lógica proposicional, incluyendo ejemplos de su uso en el lenguaje natural y los símbolos que se utilizan para representarlas.

ConectivaExpresión en el
lenguaje natural
EjemploSímbolo en
este artículo
Símbolos
alternativos
NegaciónnoNo está lloviendo.neg ,sim
ConjunciónyEstá lloviendo y está nublado.andAnd ,
DisyunciónoEstá lloviendo o está soleado.or 
Condicional materialsi... entoncesSi está soleado, entonces es de día.to ,supset
Bicondicionalsi y sólo siEstá nublado si y sólo si hay nubes visibles.leftrightarrowequiv ,
Negación conjuntani... niNi está soleado ni está nublado.downarrow , 
Disyunción excluyenteo bien... o bienO bien está soleado, o bien está nublado.nleftrightarrowoplus, notequiv

En la lógica proposicional(semántica bivalorada), las conectivas lógicas son tratados con funciones de verdad. Es decir, como funciones que toman conjuntos de valores de verdad y devuelven valores de verdad. Por ejemplo, el símbolo lógico "no" es una función que si toma el valor de verdad 1, devuelve 0, y si toma el valor de verdad 0, devuelve 1. Por lo tanto, si se aplica la función "no" a una letra que represente una proposición falsa, el resultado será algo verdadero. Si es falso que "está lloviendo", entonces será verdadero que "no está lloviendo".

El significado de las conectivas lógicas no es nada más que su comportamiento como funciones de verdad. Cada conectiva lógica se distingue de las otras por los valores de verdad que devuelve frente a las distintas combinaciones de valores de verdad que puede recibir. Esto quiere decir que el significado de cada conectiva lógica puede ilustrarse mediante una tabla que despliegue los valores de verdad que la función devuelve frente a todas las combinaciones posibles de valores de verdad que puede recibir.

NegaciónConjunciónDisyunciónCondicionalBicondicional

begin{array}{|c||c|}       phi & neg phi        hline       1 & 0        0 & 1        hline    end{array}

begin{array}{|c|c||c|}       phi & psi & phi and psi        hline       1 & 1 & 1        1 & 0 & 0        0 & 1 & 0        0 & 0 & 0        hline    end{array}

begin{array}{|c|c||c|}       phi & psi & phi or psi        hline       1 & 1 & 1        1 & 0 & 1        0 & 1 & 1        0 & 0 & 0        hline    end{array}

begin{array}{|c|c||c|}       phi & psi & phi to psi        hline       1 & 1 & 1        1 & 0 & 0        0 & 1 & 1        0 & 0 & 1        hline    end{array}

begin{array}{|c|c||c|}       phi & psi & phi leftrightarrow psi        hline       1 & 1 & 1        1 & 0 & 0        0 & 1 & 0        0 & 0 & 1        hline    end{array}

[editar] Límites de la lógica proposicional

La maquinaria de la lógica proposicional permite formalizar y teorizar sobre la validez de una gran cantidad de argumentos. Sin embargo, también existen argumentos que son intuitivamente válidos, pero cuya validez no puede ser probada por la lógica proposicional. Por ejemplo, considérese el siguiente argumento:

  1. Todos los hombres son mortales.
  2. Sócrates es un hombre.
  3. Por lo tanto, Sócrates es mortal.

Según la lógica proposicional, la forma de este argumento es la siguiente:

  1. p ,
  2. q ,
  3. therefore r

Pero esta es una forma de argumento inválida, y eso contradice nuestra intuición de que el argumento es válido. Para teorizar sobre la validez de este tipo de argumentos, se necesita investigar la estructura interna de las variables proposicionales. De esto se ocupa la lógica de primer orden. Otros sistemas formales permiten teorizar sobre otros tipos de argumentos. Por ejemplo la lógica de segundo orden, la lógica modal y la lógica temporal.

[editar] Dos sistemas formales de lógica proposicional

A continuación se presentan dos sistemas formales estándar para la lógica proposicional. El primero es un sistema axiomático simple, y el segundo es un sistema sin axiomas, de deducción natural.

[editar] Sistema axiomático

[editar] Alfabeto

El alfabeto de un sistema formal es el conjunto de símbolos que pertenecen al lenguaje del sistema. Si L es el nombre de este sistema axiomático de lógica proposicional, entonces el alfabeto de L consiste en:

  • Una cantidad finita pero arbitrariamente grande de variables proposicionales. En general se las toma del alfabeto latino, empezando por la letra p, luego q, r, etc., y utilizando subíndices cuando es necesario o conveniente. Las variables proposicionales representan proposiciones como "está lloviendo" o "los metales se expanden con el calor".
  • Un conjunto de operadores lógicos: neg, and, or, to, leftrightarrow
  • Dos signos de puntuación: los paréntesis izquierdo y derecho. Su única función es desambiguar ciertas expresiones ambiguas, en exactamente el mismo sentido en que desambiguan la expresión 2 + 2 ÷ 2, que puede significar tanto (2 + 2) ÷ 2, como 2 + (2 ÷ 2).
[editar] Gramática

Una vez definido el alfabeto, el siguiente paso es determinar qué combinaciones de símbolos pertenecen al lenguaje del sistema. Esto se logra mediante una gramática formal. La misma consiste en un conjunto de reglas que definen recursivamente las cadenas de caracteres que pertenecen al lenguaje. A las cadenas de caracteres construidas según estas reglas se las llama fórmulas bien formadas. Las reglas del sistema L son:

  1. Las variables proposicionales del alfabeto de L son fórmulas bien formadas.
  2. Si phi , es una fórmula bien formada de L, entonces neg phi , también lo es.
  3. Si phi , y psi , son fórmulas bien formadas de L, entonces (phi and psi), (phi or psi), (phi to psi) , y (phi leftrightarrow psi) también lo son.
  4. Sólo las expresiones que pueden ser generadas mediante las cláusulas 1 a 3 en un número finito de pasos son fórmulas bien formadas de L.

Según estas reglas, las siguientes cadenas de caracteres son ejemplos de fórmulas bien formadas:

p ,neg neg neg q ,(p and q)neg (p and q)(p leftrightarrow neg p)((p to q) and p)(neg (p and (q or r)) or s)

Y los siguientes son ejempos de fórmulas mal formadas:

(p) ,neg (p) ,(neg p) ,p to q ,(p and q to r)

Por otra parte, dado que la única función de los paréntesis es desambiguar las fórmulas, en general se acostumbra omitir los paréntesis externos de cada fórmula, ya que estos no cumplen ninguna función. Así por ejemplo, las siguientes fórmulas generalmente se consideran bien formadas:

p and qneg p to q ,(p and q) or neg q(p leftrightarrow q) leftrightarrow (q leftrightarrow p)
[editar] Axiomas

Los axiomas de un sistema formal son un conjunto de fórmulas bien formadas que se toman como punto de partida para demostraciones ulteriores. Un conjunto de axiomas estándar es el que descubrió Jan Łukasiewicz:

  • (phi to (psi to phi)) ,
  • ((phi to (psi to chi)) to ((phi to psi) to (phi to chi))) ,
  • ((neg phi to neg psi) to (psi to phi)) ,
[editar] Reglas de inferencia

Una regla de inferencia es una función que va de conjuntos de fórmulas a fórmulas. Al conjunto de fórmulas que la función toma como argumento se lo llama premisas, mientras que a la fórmula que devuelve como valor se la llama conclusión. En general se busca que las reglas de inferencia transmitan la verdad de las premisas a la conclusión. Es decir, que sea imposible que las premisas sean verdaderas y la conclusión falsa. En el caso de L, la única regla de inferencia es el modus ponens, el cual dice:

(phi to psi), phi vdash psi

Recordando que phi , y psi , no son fórmulas, sino metavariables que pueden ser reemplazadas por cualquier fórmula bien formada.

[editar] Ejemplo de una demostración
A demostrar: phi to phi ,
PasoFórmulaRazón
1phi to (phi to phi) ,Instancia del primer axioma.
2phi to ((phi to phi) to phi) ,Instancia del primer axioma.
3Big( phi to ((phi to phi) to phi) Big) to Big( (phi to (phi to phi)) to (phi to phi) Big)Instancia del segundo axioma.
4Big( (phi to (phi to phi)) to (phi to phi) Big)Desde (2) y (3) por modus ponens.
5phi to phi ,Desde (1) y (4) por modus ponens. Q.E.D.

[editar] Deducción natural

Artículo principal: Deducción natural

Un sistema de lógica proposicional también puede construirse a partir de un conjunto vacío de axiomas. Para ello se especifican una serie de reglas de inferencia que intentan capturar el modo en que naturalmente razonamos acerca de las conectivas lógicas.

  • Introducción de la negación:
Si suponer phi , lleva a una contradicción, entonces se puede inferir que neg phi , (reducción al absurdo).
  • Eliminación de la negación:
neg neg phi vdash phi
  • Introducción de la conjunción:
phi, psi vdash (phi and psi)phi, psi vdash (psi and phi)
  • Eliminación de la conjunción:
(phi and psi) vdash phi(phi and psi) vdash psi
  • Introducción de la disyunción:
phi vdash (phi or psi)phi vdash (psi or phi)
  • Eliminación de la disyunción:
(phi or psi), (phi to chi), (psi to chi) vdash chiSi suponer phi , lleva a una prueba de psi ,, entonces se puede inferir que (phi to psi) ,.(phi to psi), phi vdash psi
  • Introducción del bicondicional:
(phi to psi), (psi to phi) vdash (phi leftrightarrow psi)(phi to psi), (psi to phi) vdash (psi leftrightarrow phi)
  • Eliminación del bicondicional:
(phi leftrightarrow psi) vdash (phi to psi)(phi leftrightarrow psi) vdash (psi to phi)
[editar] Ejemplo de una demostración
A demostrar: phi to phi ,
PasoFórmulaRazón
1phi ,Supuesto.
2phi or phiDesde (1) por introducción de la disyunción.
3(phi or phi) and phiDesde (1) y (2) por introducción de la conjunción.
4phi ,Desde (3) por eliminación de la conjunción.
5phi vdash phiResumen de (1) hasta (4).
6vdash phi to phiDesde (5) por introducción del condicional. Q.E.D.

[editar] Lenguaje formal en la notación BNF

El lenguaje formal de la lógica proposicional se puede generar con la gramática formal descrita usando la notación BNF como sigue:

La gramática anterior define la precedencia de operadores de la siguiente manera:

  1. Negación (neg ,)
  2. Conjunción (and ,)
  3. Disyunción (or ,)
  4. Condicional material (to ,)
  5. Bicondicional (leftrightarrow)

[editar] Semántica

Una interpretación para un sistema de lógica proposicional es una asignación de valores de verdad para cada variable proposicional, sumada a la asignación usual de significados para los operadores lógicos. A cada variable proposicional se le asigna uno de dos posibles valores de verdad: o 1 (verdadero) o 0 (falso). Esto quiere decir que si hay n variables proposicionales en el sistema, el número de interpretaciones distintas es de 2n.

A partir de esto podemos definir: si phi , es una fórmula cualquiera de un lenguaje L, e I es una interpretación de L, entonces:

  • phi , es verdadera bajo la interpretación I si y sólo si I asigna el valor de verdad 1 a phi ,.
  • phi , es falsa bajo la interpretación I si y sólo si I asigna el valor de verdad 0 a phi ,.
  • phi , es una tautología (o una verdad lógica) si y sólo si para toda interpretación I, I asigna el valor de verdad 1 a phi ,.
  • phi , es una contradicción si y sólo si para toda interpretación I, I asigna el valor de verdad 0 a phi ,.
  • phi , es consistente (o satisfacible) si y sólo si existe al menos una interpretación I que asigne el valor de verdad 1 a phi ,.
  • phi , es una consecuencia semántica de un conjunto de fórmulas Γ si y sólo si para toda fórmula psi , que pertenezca a Γ, no hay ninguna interpretación en que psi , sea verdadera y phi , falsa. Cuando phi , es una consecuencia semántica de Γ en un lenguaje L, se escribe: Gamma models_L phi
  • phi , es una fórmula lógicamente válida si y sólo si phi , es una consecuencia semántica del conjunto vacío. Cuando phi , es una fórmula lógicamente válida de un lenguaje L, se escribe: models_L phi

[editar] Tablas de verdad

Artículo principal: Tablas de verdad

La tabla de verdad de una fórmula es una tabla en la que se presentan todas las posibles interpretaciones de las variables proposicionales que constituyen la fórmua y el valor de verdad de la fórmula completa para cada interpretación. Por ejemplo, la tabla de verdad para la fórmula neg (p or q) to (p to r) sería:

 begin{array}{|c|c|c||c|c|c|c|}       p & q & r & (p or q) & neg (p or q) & (p to r) & neg (p or q) to (p to r)       hline       1 & 1 & 1 & 1 & 0 & 1 & 1       1 & 1 & 0 & 1 & 0 & 0 & 1       1 & 0 & 1 & 1 & 0 & 1 & 1       1 & 0 & 0 & 1 & 0 & 0 & 1       0 & 1 & 1 & 1 & 0 & 1 & 1       0 & 1 & 0 & 1 & 0 & 1 & 1       0 & 0 & 1 & 0 & 1 & 1 & 1       0 & 0 & 0 & 0 & 1 & 1 & 1       hline end{array}

Como se ve, esta fórmula tiene 2n interpretaciones posibles —una por cada línea de la tabla—, donde n es el numero de variables proposicionales (en este caso 3, es decir p, q, r) , y resulta ser una tautología, es decir que bajo todas las interpretaciones posibles de las variables proposicionales, el valor de verdad de la fórmula completa termina siendo 1. Dependiendo de los valores de verdad que resulten de hacer la tabla las expresión lógicas pueden definirse como tautologia o valida en la cual para todos los valores de verdad de p,q y r da verdadero, además existe la contingencia o satisfacible, en la cual los valores de verdad de la expresión pueden ser verdaderos o falso, pero no todas falsas pues eso es una contradicción o insatifasible, y si habláramos de un conjunto de expresiones, se llaman valido, consistente o inconsistente. en base a esto se puede hablar de equivalencias lógicas en las cuales se cumple que son tautologias.

[editar] Formas normales

A menudo es necesario transformar una fórmula en otra, sobre todo transformar una fórmula a su forma normal. Esto se consigue transformando la fórmula en otra equivalente y repitiendo el proceso hasta conseguir una fórmula que sólo use los conectivos básicos (and, or, neg). Para lograr esto se utilizan las equivalencias logicas:

(p to q) leftrightarrow neg (p or q)(p leftrightarrow q) leftrightarrow [neg (p or q) and neg (q or p)]

Por ejemplo, considérese la siguiente fórmula:

(p to q) and (neg q leftrightarrow p)

La misma puede desarrollarse así:

(neg p or q) and (q or p) and (neg q or neg p)

Se dice que una fórmula está en forma normal disyuntiva (FND) si y sólo si tiene la siguiente forma:

A_1 or A_2 or ... or A_n

donde cada A es una conjunción de fórmulas. Por ejemplo, la siguiente fórmula está en forma normal disyuntiva:

p or (q and s) or (neg q and p)

Se dice que una fórmula está en forma normal conjuntiva (FNC) si y sólo si tiene la siguiente forma:

A_1 and A_2 and ... and A_n

donde cada A es una disjunción de fórmulas. Por ejemplo, la siguiente fórmula está en forma normal conjuntiva:

p and (q or s) and (neg q or p)

Por las leyes de De Morgan, es posible pasar de una forma normal disyuntiva a una forma normal conjuntiva y viceversa:

neg (A or B) leftrightarrow (neg A and neg B)neg (A and B) leftrightarrow (neg A or neg B)

Las FNC y FND son mutuamente duales. La demostracion hace uso de las leyes de De Morgan y de la propiedad distributiva de la conjunción y la disyunción. Se debe cumplir que:

neg [(A_1 and B_1) or (A_2 and B_2) or ... or (A_n and B_n)] leftrightarrow [(neg A_1 or neg B_1) and (neg A_2 or neg B_2) and ... and (neg A_n or neg B_n)

Y viceversa:

neg [(A_1 or B_1) and (A_2 or B_2) and ... and (A_n or B_n)] leftrightarrow [(neg A_1 and neg B_1) or (neg A_2 and neg B_2) or ... or (neg A_n and neg B_n)

[editar] La lógica proposicional y la computación

Debido a que los computadores trabajan con información binaria, la herramienta matemática adecuada para el análisis y diseño de su funcionamiento es el Álgebra de Boole. El Álgebra de Boole fue desarrollada inicialmente para el estudio de la lógica. Ha sido a partir de 1938, fecha en que Claude Shannon publicó un libro llamado "Análisis simbólico de circuitos con relés", estableciendo los primeros conceptos de la actual teoría de la conmutación, cuando se ha producido un aumento considerable en el número de trabajos de aplicación del Álgebra de Boole a los computadores digitales. Hoy en día, esta herramienta resulta fundamental para el desarrollo de los computadores ya que, con su ayuda, el análisis y síntesis de combinaciones complejas de circuitos lógicos puede realizarse con rapidez.

[editar] Aristóteles con respecto al estudio de la lógica

La lógica es conocida como una de las ciencias más antiguas, tanto es así que se le atribuye a Aristóteles la paternidad de esta disciplina. Partiendo de que corresponde a Aristóteles haber sido el primero en tratar con todo detalle la lógica, se le considera pues ser su fundador. En un principio se llamó Analítica, en virtud del título de las obras en que trató los problemas lógicos. Más tarde los escritos de Aristóteles relativos a estos eventos fueron recopilados por sus discípulos con el título de Organon, por considerar que la lógica era un instrumento para el conocimiento de la verdad.

Aristóteles se planteo cómo es posible probar y demostrar que un conocimiento es verdadero, es decir, que tiene una validez universal. Aristóteles encuentra el fundamento de la demostración en la deducción, procedimiento que consiste en derivar un hecho particular de algo universal. La forma en que se afecta esa derivación es el silogismo, por cuya razón la silogística llega a ser el centro de la lógica aristotélica.

[editar] Véase también

[editar] Bibliografía básica

Enderton, H.B., A Mathemátical introduction to Logic, Academic Press, 1972.

Hamilton, A.G., Lógica para matemáticos, Paraningo, 1981.

Mendelson, E., Introduction to Mathematical Logic, 3ª. ed.,Wadworth an Brook/Cole, 1987, 4ª ed.,Chapman and may, 1997.

Pla, J., Lliçons de lógica matemática, P.P.U., 1991.

[editar] Bibliografía complementaria

Badesa, C., Jané, I., Jansana, R., Elementos de lógica formal, Ariel, 1998.

Barnes, D.W., Mack, J.M., Una introducción algebraica a la lógica matemática, Eunibar, 1978.

Bridge, J., Beginning Model Theory, Oxford University Press, 1977.

Ershov, Y., Paliutin. E., Lógica matemática, Mir, 1990.

Hofstadter, D., Gödel, Escher, Bach: un Eterno y Grácil Bucle, Tusquets Editores, Barcelona, 1987.

Jané, I., Álgebras de Boole y lógica, Publs. U.B., 1989.

Monk, J.D., Mathematical Logic, Springer-Verlag, 1976.

Nidditch, P.H., El desarrollo de la lógica matemática. Ediciones Cátedra, 1978.

Van Dalen, D., Logic and Structure, 2nd ed., Universitext, Springer-Verlag, 1983.

[editar] Notas y referencias

  1. Simon Blackburn, ed., «propositional calculus» (en inglés), Oxford Dictionary of Philosophy, Oxford University Press, http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t98.e2552, consultado el 13 de agosto de 2009 

[editar] Enlaces externos

02/11/2010 15:11 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ALGEBRA. El álgebra es la rama de las matemáticas que estudia las estructuras, las relaciones y las cantidades (en el caso del álgebra elemental). Es una de las principales ramas de la matemática, junto a la geometría, el análisis matemático, la combinatoria y la teoría de números.

Álgebra

De Wikipedia, la enciclopedia libre
Para los usos matemáticos de la palabra álgebra como estructura algebraica, véase álgebra no asociativa, álgebra asociativa, álgebra sobre un cuerpo.

El álgebra es la rama de las matemáticas que estudia las estructuras, las relaciones y las cantidades (en el caso del álgebra elemental). Es una de las principales ramas de la matemática, junto a la geometría, el análisis matemático, la combinatoria y la teoría de números.

La palabra «álgebra» es de origen árabe, deriva del tratado escrito por el matemático persa Muhammad ibn Musa al-Jwarizmi, titulado Kitab al-yabr wa-l-muqabala (en árabe كتاب الجبر والمقابلة) (que significa "Compendio de cálculo por el método de completado y balanceado"), el cual proporcionaba operaciones simbólicas para la solución sistemática de ecuaciones lineales y cuadráticas. Etimológicamente, la palabra «álgebra» جبر (yabr) , proviene del árabe y significa "reducción".

Contenido

[ocultar]

[editar] Álgebra elemental

Artículo principal: Álgebra elemental

Álgebra elemental es la forma más básica del álgebra. A diferencia de la aritmética, en donde solo se usan los números y sus operaciones aritméticas (como +, −, ×, ÷), en álgebra los números son representados por símbolos (usualmente a, b, c, x, y, z). Esto es útil porque:

  • Permite la formulación general de leyes de aritmética (como a + b = b + a), y esto es el primer paso para una exploración sistemática de las propiedades de los números reales.
  • Permite referirse a números "desconocidos", formular ecuaciones y el estudio de cómo resolverlas.
  • Permite la formulación de relaciones funcionales.

[editar] Historia

Si bien la palabra "álgebra" viene de la palabra árabe (al-Jabr, الجبر), sus orígenes se remontan a los antiguos babilonios, que habían desarrollado un avanzado sistema aritmético con el que fueron capaces de hacer cálculos en una forma algebraica. Con el uso de este sistema fueron capaces de aplicar las fórmulas y soluciones para calcular valores desconocidos. Este tipo de problemas suelen resolverse hoy mediante ecuaciones lineales, ecuaciones de segundo grado y ecuaciones indefinidas. Por el contrario, la mayoría de los egipcios de esta época, y la mayoría de la India, griegos y matemáticos chinos en el primer milenio antes de Cristo, normalmente resolvían tales ecuaciones por métodos geométricos, tales como los descritos en la matemática Rhind Papyrus, Sulba Sutras, Elementos de Euclides, y los Nueve Capítulos sobre el Arte de las Matemáticas. El trabajo geométrico de los griegos, centrado en las formas, dio el marco para la generalización de las fórmulas más allá de la solución de los problemas particulares de carácter más general, sino en los sistemas de exponer y resolver ecuaciones.

Las mentes griegas matemáticas de Alejandría y Diofanto siguieron las tradiciones de Egipto y Babilonia, pero el Diophantus del libro Arithmetica está en un nivel mucho más alto. Más tarde, los matemáticos árabes y musulmanes desarrollaron métodos algebraicos a un grado mucho mayor de sofisticación. Aunque los babilonios y Diophantus utilizaron sobre todo los métodos especiales ad hoc para resolver ecuaciones, Al-Khowarizmi fue el primero en resolver ecuaciones usando métodos generales. Él resolvió el indeterminado de ecuaciones lineales, ecuaciones cuadráticas, ecuaciones indeterminadas de segundo orden y ecuaciones con múltiples variables.

La palabra "álgebra" es el nombre de la palabra árabe "Al-Jabr, الجبر" en el título del libro al-Kitab al-muḫtaṣar fi al-Gabr ḥisāb wa-l-muqābala, الكتاب المختصر في حساب الجبر والمقابلة, el sentido del Resumen del libro se refiere a la transposición y Cálculo de la Reducción de un libro escrito por el matemático persa islámico, Muhammad ibn Musa Al-Khwārizmī (considerado el "padre del álgebra"), en 820. La palabra Al-Jabr significa "reducción". El matemático helenístico Diophantus ha sido tradicionalmente conocido como el "padre del álgebra", pero en tiempos más recientes, hay mucho debate sobre si al-Khwarizmi, que fundó la disciplina de Al-Jabr, título que se merece su lugar. Los que apoyan Diophantus apuntan al hecho de que el álgebra que se encuentra en Al-Jabr es algo más elemental que el que se encuentra en el álgebra Arithmetica y que Arithmetica es sincopada mientras que Al-Jabr es totalmente retórica. Los que apoyan el punto de Al-Khwarizmi sobre el hecho de que presenta los métodos de "reducción" y "equilibrio" (la transposición de términos restará al otro lado de una ecuación, es decir, la cancelación de términos a ambos lados de la ecuación), al cual el término Al-Jabr se refería originalmente, y que dio una explicación exhaustiva de la solución de ecuaciones cuadráticas, apoyada por las pruebas geométricas, mientras que el tratamiento de álgebra como una disciplina independiente en su propio derecho. Su álgebra ya tampoco trataría "con una serie de los problemas por resolver", sino con una "exposición que empieza con lo primitivo en el que las combinaciones deben dar todos los posibles prototipos de ecuaciones, que en adelante explícitamente constituyen el verdadero objeto de estudio". También estudió una ecuación para su propio bien y "de forma genérica, en la medida que no sólo surgen en el curso de la solución de un problema, sino que específicamente en la llamada para definir una infinidad de problemas de clase".

El matemático persa Omar Khayyam desarrolló la geometría algebraica y encontró la solución geométrica de la ecuación cúbica. Otro matemático persa, Sharaf Al-Din al-Tusi, encontró la solución numérica y algebraica a diversos casos de ecuaciones cúbicas. Él también desarrolló el concepto de una función. Los matemáticos indios Mahavirá y Bhaskara II, el matemático persa Al-Karaji, y el matemático chino Zhu Shijie, resolvieron varios casos de cúbicos, quartic, quintic y ecuaciones polinómicas de orden superior mediante métodos numéricos.

Otro acontecimiento clave en el desarrollo del álgebra fue la solución algebraica de las ecuaciones cúbicas y quárticas, desarrollado a mediados del siglo XVI. La idea de un factor determinante fue desarrollada por el matemático japonés Kowa Seki en el siglo XVII, seguido por Gottfried Leibniz diez años más tarde, con el fin de resolver sistemas de ecuaciones lineales simultáneas utilizando matrices. Gabriel Cramer también hizo un trabajo sobre matrices y determinantes en el siglo XVIII. Resumen de álgebra se desarrolló en el siglo XIX, centrándose inicialmente en lo que ahora se llama la teoría de Galois, y en cuestiones de constructibilidad.

[editar] Estructura algebraica

Artículo principal: Estructura algebraica

En matemáticas, una estructura algebraica es un conjunto de elementos con unas propiedades operacionales determinadas; es decir, lo que define a la estructura del conjunto son las operaciones que se pueden realizar con los elementos de dicho conjunto y las propiedades matemáticas que dichas operaciones poseen. Un objeto matemático constituido por un conjunto no vacío y algunas leyes de composición interna definida en él es una estructura algebraica. Las estructuras algebraicas más importantes son:

EstructuraLey internaAsociatividadNeutroInversoConmutatividad
MagmaYes check.svg    
SemigrupoYes check.svgYes check.svg   
MonoideYes check.svgYes check.svgYes check.svg  
Monoide abelianoYes check.svgYes check.svgYes check.svg Yes check.svg
GrupoYes check.svgYes check.svgYes check.svgYes check.svg 
Grupo abelianoYes check.svgYes check.svgYes check.svgYes check.svgYes check.svg

 

Estructura (A,+,·)(A,+)(A,·)
SemianilloMonoide abelianoMonoide
AnilloGrupo abelianoSemigrupo
CuerpoGrupo abelianoGrupo abeliano

 

[editar] Signos y símbolos

En el álgebra se utilizan signos y símbolos -en general utilizados en la teoría de conjuntos- que constituyen ecuaciones, matrices, series, etc. Sus letras son llamadas variables, ya que se usa esa misma letra en otros problemas y su valor va variando.

Aquí algunos ejemplos:

Signos y Símbolos
ExpresiónUso
+Además de expresar adición, también es usada para expresar operaciones binarias
c ó kExpresan Términos constantes
Primeras letras del abecedario
a, b, c,...
Se utilizan para expresar cantidades conocidas
Últimas letras del abecedario
...,x, y, z
Se utilizan para expresar incógnitas
nExpresa cualquier número (1,2,3,4,...,n)
Exponentes y subíndices
a', a'', a'''; a _1, a _2, a _3 !
Expresar cantidades de la misma especie, de diferente magnitud.
  
  

[editar] Véase también

[editar] Enlaces externos

01/11/2010 15:45 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: EL LENGUAJE MATEMÁTICO. El lenguaje matemático es una forma de comunicación a través de símbolos especiales para realizar cálculos matemáticos.

El Lenguaje Matemático

 

El lenguaje matemático es una forma de comunicación a través de símbolos especiales para realizar cálculos matemáticos.

A continuación algunos ejemplos expresados en lenguaje natural y/o lenguaje matemático:

  • En el lenguaje natural no se utiliza el cero como numero.

  • En el lenguaje natural, sumar es aumentar y restar es disminuir. En el lenguaje matemático, sumar es aumentar o disminuir (si se suma un número negativo).

  • Cuando se dice un número, en el lenguaje natural se refiere a uno cualquiera determinado, mientras que en el lenguaje matemático se refiere a todos los números.

  • En el lenguaje matemático una curva simple es una curva que no se corta a si misma, aunque su forma sea extraordinariamente complicada.

Las matemáticas siempre se ligan a la existencia de símbolos que, paradójicamente, son necesarios para expresarlas de forma concisa y sencilla.

Como muestra, dos ejemplos de la forma en que simplifican los símbolos:

  • Euclídes (300 a.C.): Si un segmento rectilíneo se corta por un punto arbitrario, el cuadrado del total es igual a los cuadrados de cada uno de los segmentos y el doble del rectángulo cuyos lados son los segmentos.

Con símbolos: (a + b)2 = a2 + b2 + 2ab.

  • Arquímedes (225 a.C.): El área de un círculo es igual a la del triangulo cuya base es el perímetro de su circunferencia y la altura es igual al radio.

Con símbolos: A = ¼ r 2.

 

Obtenido de http://www.monografias.com/trabajos76/lenguaje-matematico-aplicaciones/lenguaje-matematico-aplicaciones.shtml

01/11/2010 12:34 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿PODRÍAMOS RAZONAR NUESTRA FORMA Y LA DE LOS ANIMALES?. El término canguro es el nombre común que se utiliza para designar a las especies de mayor tamaño de la subfamilia Macropodinae, tal como el término walabí se utiliza para denominar a las de menor tamaño. Se utiliza también a veces en un sentido más amplio para referirse a todos los miembros de la familia de los macrópodos. Sin embargo, el término no responde a una clasificación científica, por lo que especies pertenecientes a un mismo género (agrupación de especies estrechamente relacionadas entre sí) pueden ser llamadas canguro, walabí o walarú, sólo dependiendo de su tamaño. Por ejemplo, Macropus parma es conocido como el walabí de Parma,[1] mientras que Macropus antilopinus, es denominado indistintamente como canguro antílope o walarú antílope.

 

Canguro

De Wikipedia, la enciclopedia libre
 
Canguros
Kangaroo and joey03.jpg
Macropus giganteus
Clasificación científica
Reino:Animalia
Filo:Chordata
Clase:Mammalia
Subclase:Marsupialia
Orden:Diprotodontia
Familia:Macropodidae
Subfamilia:Macropodinae (parte)
Gray, 1821
Géneros

ver texto

El término canguro es el nombre común que se utiliza para designar a las especies de mayor tamaño de la subfamilia Macropodinae, tal como el término walabí se utiliza para denominar a las de menor tamaño. Se utiliza también a veces en un sentido más amplio para referirse a todos los miembros de la familia de los macrópodos. Sin embargo, el término no responde a una clasificación científica, por lo que especies pertenecientes a un mismo género (agrupación de especies estrechamente relacionadas entre sí) pueden ser llamadas canguro, walabí o walarú, sólo dependiendo de su tamaño. Por ejemplo, Macropus parma es conocido como el walabí de Parma,[1] mientras que Macropus antilopinus, es denominado indistintamente como canguro antílope o walarú antílope.[2]

La subfamilia Macropodinae incluye, además de las especies de canguros, walabís y walarús, otras comúnmente conocidas como canguros arborícolas, cuocas, dorcopsis y pademelones.

Existen muchas especies denominadas canguro, y aquí se ven reflejadas tres de ellas:

  • El canguro rojo (Macropus rufus), el cual es el mayor de los canguros y el mayor de los marsupiales aún en existencia. Los canguros rojos ocupan el centro árido y semi-árido de Australia. Un macho adulto puede medir 1,5 m de altura y pesar 85 kg.
  • El canguro gris oriental (Macropus giganteus), menos conocido que el canguro rojo, pero avistado más frecuentemente, ya que su rango cubre el área oriental fértil australiana.
  • El canguro gris occidental (Macropus fuliginosus), de tamaño menor y encontrado al sur de la Australia occidental, sur de Australia cerca de la costa y en la cuenca del río Darling.

Los canguros poseen grandes y poderosas patas traseras, grandes pies diseñados para saltar, una cola larga y musculosa para mantener el equilibrio y una cabeza pequeña. Los canguros son herbívoros, alimentándose de pasto y raíces. Todas las especies son nocturnas y crepusculares, usualmente pasando el día en quietud y alimentándose durante las tardes y noches frías, generalmente en grupos. Tienen una esperanza de vida de 18 años aproximadamente.

Los canguros se encuentran principalmente en Oceanía. Popularmente el canguro es conocido como el animal más representativo de Australia.

Contenido

[ocultar]
//

[editar] Origen del nombre

La palabra canguro deriva de gangurru, una palabra del Guugu Yimidhirr (una lengua aborigen australiana), que se refería al canguro gris. El nombre fue escrito por primera vez (en su versión inglesa kangaroo) por el Teniente James Cook el 4 de agosto de 1770.

Una leyenda extendida afirma que en realidad el nombre canguro habría surgido al preguntar los occidentales el nombre de aquel animal y ser esto lo que respondían los aborígenes; su significado, sin embargo, no era el nombre del animal, sino la frase "no le entiendo".[3]

[editar] Reproducción

Su reproducción es sexual y varía mucho con las especies. El canguro rojo es un reproductor oportunista, ya que se aparea y reproduce cuando las condiciones estacionales son favorables para la cría de la prole. Los canguros grises procrean durante todo el año, pero paren más crías en los meses de verano, pues salen de la bolsa en la época ideal, la primavera. Otras especies tienen una estación reproductora más restringida.

El galanteo puede durar unas pocas horas o prolongarse 2 ó 3 días. El macho sigue a la hembra que está en celo, husmeando con frecuencia la abertura de la bolsa urogenital y tocando la cola de la hembra con la pata. El ualabi macho hace característicos movimientos laterales y sinuosos con la cola, que producen chasquidos; el apareamiento puede ser breve o durar más de una hora, como en el caso del canguro gris.

En bastantes especies, como el cuoca, el apareamiento tiene lugar después del parto (estro post partum); en estos casos se suele producir un blastocito en reposo, que se desarrolla más tarde, cuando la cría del parto anterior abandone el marsupio. Las crías nacen entre los 28 y 36 días del apareamiento. Son de un tamaño muy pequeño. Normalmente nace una sola cría, pero se han dado casos de nacer gemelos. Suben trepando por la pared exterior del cuerpo, agarrándose a los pelos de la madre, hasta llegar a la bolsa marsupial, donde se introducen y se agarran a uno de los cuatro pezones. Permanecen en la bolsa unos 8 meses, pero siguen volviendo a ella para mamar alrededor de seis meses más; en ese tiempo ya habrá nacido otra cría. Los jóvenes suelen relacionarse con sus madres hasta que alcanzan la madurez sexual.

Miden hasta tres metros de altura y cuando nacen llegan a medir entre veinte y treinta centímetros.

[editar] Locomoción

Los canguros son los únicos animales grandes que se desplazan dando saltos. Los saltos, que los hacen moviendo sus piernas a la vez, son un modo de locomoción rápido y económico, pues a altas velocidades consumen una fracción de la energía que consumirían desplazándose de otra manera.[4]

La velocidad de desplazamiento confortable del canguro rojo es de 20–25 km/h, pero puede alcanzar velocidades de hasta 70 km/h en distancias cortas, y puede mantener una velocidad de unos 40 km/h por casi dos km.[5]

Debido al largo de sus pies, no puede caminar correctamente. Para moverse a velocidades bajas usa su cola como un trípode, junto con sus patas delanteras. Así puede mover sus pies un paso hacia adelante.[5]

[editar] Clasificación

[editar] Véase también

[editar] Enlaces externos

[editar] Referencias

  1. Groves, Colin (16 de noviembre de 2005). Wilson, D. E., y Reeder, D. M. (eds). ed. Mammal Species of the World (3ª edición edición). Johns Hopkins University Press. pp. 65. ISBN 0-8018-8221-4. http://www.bucknell.edu/msw3. 
  2. Menkhorst, Peter (2001). Guía de Campo de los Mamíferos de Australia. Oxford University Press. pp. 110. 
  3. "I do not understand"
  4. Alexander, R. Elastic Energy Stores in Running Vertebrates. American Zoologist 1984 24(1):85-94. (Resumen)
  5. a b Penny, Malcolm (2002). The Secret Life of Kangaroos. Austin, Texas: Raintree Steck-Vaughn Puiblishers. ISBN 0-7398-4986-7.

31/10/2010 19:13 petalofucsia #. Matemáticas Hay 1 comentario.

MATEMÁTICAS: ¿CUÁLES SON LAS LEYES DE LA FORMA O LAS LEYES TRIGONOMÉTRICAS?. La trigonometría es una rama de la matemática, cuyo significado etimológico es "la medición de los triángulos". Se deriva del vocablo griego τριγωνο "triángulo" + μετρον "medida".

Trigonometría

De Wikipedia, la enciclopedia libre
Trigonometria 02.svg

La trigonometría es una rama de la matemática, cuyo significado etimológico es "la medición de los triángulos". Se deriva del vocablo griego τριγωνο <trigōno> "triángulo" + μετρον <metron> "medida".[1]

La trigonometría es la rama de las matemáticas que estudia las relaciones entre los ángulos y los lados de los triángulos. Para esto se vale de las razones trigonométricas, las cuales son utilizadas frecuentemente en cálculos técnicos.

En términos generales, la trigonometría es el estudio de las funciones seno, coseno; tangente, cotangente; secante y cosecante. Interviene directa o indirectamente en las demás ramas de la matemática y se aplica en todos aquellos ámbitos donde se requieren medidas de precisión. La trigonometría se aplica a otras ramas de la geometría, como es el caso del estudio de las esferas en la geometría del espacio.

Posee numerosas aplicaciones: las técnicas de triangulación, por ejemplo, son usadas en astronomía para medir distancias a estrellas próximas, en la medición de distancias entre puntos geográficos, y en sistemas de navegación por satélites.

El Canadarm 2, un brazo manipulador robótico gigantesco de la Estación Espacial Internacional. Este manipulador es operado controlando los ángulos de sus articulaciones. Calcular la posición final del astronauta en el extremo del brazo requiere un uso repetido de las funciones trigonómetricas de esos ángulos que se forman por los varios movimientos que se realizan.

Contenido

[ocultar]

[editar] Unidades angulares

En la medida de ángulos, y por tanto en trigonometría, se emplean tres unidades, si bien la más utilizada en la vida cotidiana es el Grado sexagesimal, en matemáticas es el Radián la más utilizada, y se define como la unidad natural para medir ángulos, el Grado centesimal se desarrolló como la unidad más próxima al sistema decimal, se usa en topografía, arquitectura o en construcción.

  • Radián: unidad angular natural en trigonometría, será la que aquí utilicemos. En una circunferencia completa hay 2π radianes.
  • Grado sexagesimal: unidad angular que divide una circunferencia en 360 grados.
  • Grado centesimal: unidad angular que divide la circunferencia en 400 grados centesimales.

[editar] Las funciones trigonométricas

Artículo principal: Función trigonométrica

La trigonometría como rama de las matemáticas realiza su estudio en la relación entre lados y ángulos de un triángulo rectángulo, con una aplicación inmediata en geometría y sus aplicaciones, para el desarrollo de este fin se definieron una serie de funciones, que han sobrepasado su fin original, convirtiendo en muchos casos en elementos matemáticos estudiados en sí mismos, y con aplicaciones en los campos más diversos.

[editar] Razones trigonométricas

Trigono b00.svg

El triángulo ABC es un triángulo rectángulo en C; lo usaremos para definir las razones seno, coseno y tangente, del ángulo  alpha , , correspondiente al vértice A, situado en el centro de la circunferencia.

  • El seno (abreviado como sen, o sin por llamarse "sinus" en latín) es la razón entre el cateto opuesto sobre la hipotenusa,
    operatorname {sen} , alpha =    frac{overline{CB}}{overline{AB}} =    frac{a}{c}
  • El coseno (abreviado como cos) es la razón entre el cateto adyacente sobre la hipotenusa,
    cosalpha =    frac{overline{AC}}{overline{AB}} =    frac{b}{c}
  • La tangente (abreviado como tan o tg) es la razón entre el cateto opuesto sobre el cateto adyacente,
    tanalpha =    frac{overline{CB}}{overline{AC}} =    frac{a}{b}

[editar] Razones trigonométricas recíprocas

Trigono d00.svg
  • La Cosecante: (abreviado como csc o cosec) es la razón recíproca de seno, o también su inverso multiplicativo:
    csc alpha =    frac{1}{operatorname {sen} ; alpha} =    frac{c}{a}

En el esquema su representación geométrica es:

    csc alpha =    overline{AG}
  • La Secante: (abreviado como sec) es la razón recíproca de coseno, o también su inverso multiplicativo:
    sec alpha =    frac{1}{cos alpha} =    frac{c}{b}

En el esquema su representación geométrica es:

    sec alpha =    overline{AD}
  • La Cotangente: (abreviado como cot o cta) es la razón recíproca de la tangente, o también su inverso multiplicativo:
    cot alpha =    frac{1}{tan alpha} =    frac{b}{a}

En el esquema su representación geométrica es:

    cot alpha =    overline{GF}

Normalmente se emplean las relaciones trigonométricas seno, coseno y tangente, y salvo que haya un interés especifico en hablar de ellos o las expresiones matemáticas se simplifiquen mucho, los términos cosecante, secante y cotangente no suelen utilizarse.

[editar] Otras funciones trigonométricas

Además de las funciones anteriores existen otras funciones trigonométricas, matemáticamente se pueden definir empleando las ya vistas, su uso no es muy corriente, pero si se emplean dado su sentido geométrico, veamos:

El seno cardinal o función sinc (x) definida:

    operatorname {sinc} ; (x) = frac{sin(x)}{x}

El verseno, es la distancia que hay entre la cuerda y el arco en una circunferencia, tambien se denomina sagita o flecha, se define:

    operatorname {versen} ; alpha = 1 - cos alpha

El semiverseno, se utiliza en navegación al intervenir en el calculo esférico:

    operatorname {semiversen} ; alpha = frac {operatorname {versen} ; alpha }{2}

El coverseno,

    operatorname {coversen} ; alpha = 1 - operatorname {sen} ;  alpha

El semicoverseno

    operatorname {semicoversen} ; alpha = frac { operatorname {coversen} ; alpha }{2}

El exsecante:

    operatorname {exsec} ; alpha = sec alpha - 1

[editar] Funciones trigonométricas inversas

En trigonometría, cuando el ángulo se expresa en radianes (dado que un radián es el arco de circunferencia de longitud igual al radio), suele denominarse arco a cualquier cantidad expresada en radianes; por eso las funciones inversas se denominan con el prefijo arco, así si:

 y= operatorname {sen} , x ,

y es igual al seno de x, la función inversa:

 x = operatorname {arcsen} ; y ,

x es el arco cuyo seno vale y, o también x es el arcoseno de y.

si:

 y= cos x ,

y es igual al coseno de x, la función inversa:

 x = arccos y ,

x es el arco cuyo coseno vale y, que se dice: x es el arcocoseno de y.

si:

 y= tan x ,

y es igual al tangente de x, la función inversa:

 x = arctan y ,

x es el arco cuya tangente vale y, ó x es igual al arcotangente de y.

[editar] Valor de las funciones trigonométricas

A continuación algunos valores de las funciones que es conveniente recordar:

RadiánCircunferencia.svgSexaCircunferencia.svg
Circunferencia en radianes.Circunferencia en Grado sexagesimal.

 

 RadianesGrados sexag.senocosenotangentecosecantesecantecotangente
Angulo000.svg 0  ;  0^o ,frac{sqrt{0}}{2}=0frac{sqrt{4}}{2}=10 ,nexists (pm infty) ,!1 ,nexists (pm infty)  ,!
Angulo030.svg frac{1}{6}pi 30^o ,frac{sqrt{1}}{2}=frac{1}{2}frac{sqrt{3}}{2}frac{sqrt{3}}{3}2 ,frac{2sqrt{3}}{3}sqrt{3}
Angulo045.svg frac{1}{4}pi 45^o ,frac{sqrt{2}}{2}frac{sqrt{2}}{2}1 ,sqrt{2}sqrt{2}1 ,
Angulo060.svg frac{1}{3} pi60^o ,frac{sqrt{3}}{2}frac{sqrt{1}}{2}=frac{1}{2}sqrt{3}frac{2sqrt{3}}{3}2 ,frac{sqrt{3}}{3}
Angulo090.svg frac{1}{2} pi90^o ,frac{sqrt{4}}{2}=1frac{sqrt{0}}{2}=0nexists (pm infty) ,!1 ,nexists (pm infty) ,!0 ,

Para el calculo del valor de las funciones trigonométricas se confeccionaron tablas trigonométricas. La primera de estas tablas fue desarrollada por Johann Müller Regiomontano en 1467, que nos permiten, conocido un ángulo, calcular los valores de sus funciones trigonométricas. En la actualidad dado el desarrollo de la informática, en prácticamente todos los lenguajes de programación existen librerías de funciones que realizan estos cálculos, incorporadas incluso en calculadoras electrónicas de bolsillo, por lo que el empleo actual de las tablas resulta obsoleto.

[editar] Sentido de las funciones trigonométricas

Trigono c00.svg

Dados los ejes de coordenadas cartesianas xy, de centro O, y una circunferencia goniométrica (circunferencia de radio la unidad) con centro en O; el punto de corte de la circunferencia con el lado positivo de las x, lo señalamos como punto E.

Notese que el punto A es el vertice del triangulo, y O es el centro de coordenada del sistema de referencia:

 A equiv O

a todos los efectos.

La recta r, que pasa por O y forma un ángulo  alpha , sobre el eje de las x, corta a la circunferencia en el punto B, la vertical que pasa por B, corta al eje x en C, la vertical que pasa por E corta a la recta r en el punto D.

Por semejanza de triángulos:

 frac{; overline{CB} ;}{overline{OC}} = frac{; overline{ED} ;}{overline{OE}}

Los puntos E y B están en la circunferencia de centro O, por eso la distancia  overline{OE} y  overline{OB} son el radio de la circunferencia, en este caso al ser una circunferencia de radio = 1, y dadas las definiciones de las funciones trigonométricas:

 operatorname {sen} alpha = overline{CB} ,  cos alpha = overline{OC} ,  tan alpha = overline{ED} ,

tenemos:

 frac{operatorname {sen} alpha}{ cos alpha} = frac{tan alpha}{1}

La tangente es la relación del seno entre el coseno, según la definición ya expuesta.

[editar] Primer cuadrante

Trigono 000.svg
Trigono 001.svg
Trigono 002.svg
Trigono 003.svg

Para ver la evolución de las funciones trigonométricas según aumenta el ángulo, daremos una vuelta completa a la circunferencia, viéndolo por cuadrantes, los segmentos correspondientes a cada función trigonométrica variaran de longitud, siendo esta variación función del ángulo, partiendo en el primer cuadrante de un ángulo cero.

Partiendo de esta representación geométrica de las funciones trigonométricas, podemos ver las variaciones de las funciones a medida que aumenta el ángulo  alpha ,.

Para  alpha = 0 , , tenemos que B, D, y C coinciden en E, por tanto:

 operatorname {sen} 0 = 0 ,  cos 0 = 1 ,  tan 0 = 0 ,

Si aumentamos progresivamente el valor de  alpha , , las distancias  overline{CB} y  overline{ED} aumentarán progresivamente, mientras que  overline{OC} disminuirá.

Percatarse que el punto B es de la circunferencia y cuando el ángulo aumenta se desplaza sobre ella.

El punto E es la intersección de la circunferencia con el eje x y no varia de posición.

Los segmentos:  overline{OC} y  overline{CB} están limitados por la circunferencia y por tanto su máximo valor absoluto será 1, pero  overline{ED} no está limitado, dado que D es el punto de corte de la recta r que pasa por O, y la vertical que pasa por E, en el momento en el que el ángulo  alpha = 0,5 pi , rad, la recta r será la vertical que pasa por O. Dos rectas verticales no se cortan, o lo que es lo mismo la distancia  overline{ED} será infinita.

El punto C coincide con A y el coseno vale cero. El punto B esta en el eje y en el punto más alto de la circunferencia y el seno toma su mayor valor: uno.

Para un ángulo recto las funciones toman los valores:

 operatorname {sen} frac{pi}{2} = 1 ,  cos frac{pi}{2} = 0 ,  tan frac{pi}{2} = infty ,



[editar] Segundo cuadrante

Trigono 004.svg
Trigono 005.svg
Trigono 006.svg

Cuando el ángulo  alpha , supera el ángulo recto, el valor del seno empieza a disminuir según el segmento  overline{CB} , el coseno aumenta según el segmento  overline{OC} , pero en el sentido negativo de las x, el valor del coseno toma sentido negativo, si bien su valor absoluto aumenta cuando el ángulo sigue creciendo.

La tangente para un ángulo  alpha , inferior a  0,5pi , rad se hace infinita en el sentido positivo de las y, para el ángulo recto la recta vertical r que pasa por O y la vertical que pasa por E no se cortan, por lo tanto la tangente no toma ningún valor real, cuando el ángulo supera los  0,5pi , rad y pasa al segundo cuadrante la prolongación de r corta a la vertical que pasa por E en el punto D real, en el lado negativo de las y, la tangente  overline{ED} por tanto toma valor negativo en el sentido de las y, y su valor absoluto disminuye a medida que el ángulo  alpha , aumenta progresivamente hasta los  pi , rad.

Resumiendo: en el segundo cuadrante el seno de  alpha , ,  overline{CB} , disminuye progresivamente su valor desde 1, que toma para  alpha = 0,5 pi , rad, hasta que valga 0, para  alpha = pi , rad, el coseno, overline{OC} , toma valor negativo y su valor varia desde 0 para  alpha = 0,5 pi , rad, hasta –1, para  alpha = pi , rad.

La tangente conserva la relación:

 tan alpha = frac{operatorname{sen} alpha} {cos alpha}

incluyendo el signo de estos valores.

Para un ángulo llano tenemos que el punto D esta en E, y B y C coinciden en el eje de las x en el lado opuesto de E, con lo que tenemos:

 operatorname {sen} ; pi = 0 ,  cos pi = -1 ,  tan pi = 0 ,

 

[editar] Tercer cuadrante

Trigono 007.svg
Trigono 008.svg
Trigono 009.svg

En el tercer cuadrante, comprendido entre los valores del ángulo  alpha = pi , rad a  alpha = 1,5  pi , rad, se produce un cambio de los valores del seno el coseno y la tangente, desde los que toman para  pi , rad:

 operatorname {sen} frac{3pi}{2} = -1 ,  cos frac{3pi}{2} = 0 ,  tan frac{3pi}{2} = infty ,

Cuando el ángulo  alpha , aumenta progresivamente, el seno aumenta en valor absoluto en el sentido negativo de las y, el coseno disminuye en valor absoluto en el lado negativo de las x, y la tangente aumenta del mismo modo que lo hacia en el primer cuadrante.

A medida que el ángulo crece el punto C se acerca a O, y el segmento  overline{OC} , el coseno, se hace más pequeño en el lado negativo de las x.

El punto B, intersección de la circunferencia y la vertical que pasa por C, se aleja del eje de las x, en el sentido negativo de las y, el seno,  overline{CB} .

Y el punto D, intersección de la prolongación de la recta r y la vertical que pasa por E, se aleja del eje las x en el sentido positivo de las y, con lo que la tangente,  overline{ED} , aumenta igual que en el primer cuadrante

Cuando el ángulo  alpha , alcance  1,5 pi , rad, el punto C coincide con O y el coseno valdrá cero, el segmento  overline{CB} será igual al radio de la circunferencia, en el lado negativo de las y, y el seno valdrá –1, la recta r del ángulo y la vertical que pasa por E serán paralelas y la tangente tomara valor infinito por el lado positivo de las y.

El seno el coseno y la tangente siguen conservando la misma relación:

    tan alpha =    frac{operatorname{sen} alpha} {cos alpha}

que se cumple tanto en valor como en signo, nótese que cuando el coseno vale cero, la tangente se hace infinito.

[editar] Cuarto cuadrante

Trigono 010.svg
Trigono 011.svg
Trigono 012.svg

En el cuarto cuadrante, que comprende los valores del ángulo  alpha , entre  1,5 pi , rad y  2 pi , rad, las variables trigonométricas varían desde los valores que toman para  1,5 pi , rad:

 operatorname {sen} (1,5 , pi ) = -1 ,  cos(1,5 , pi ) = 0 ,  tan(1,5 , pi ) = infty ,

hasta los que toman para  2 pi , rad pasando al primer cuadrante, completando una rotación:

 operatorname {sen} (2 , pi ) = operatorname {sen}; 0 = 0 ,  cos(2 , pi ) = cos 0 = 1 ,  tan(2 , pi ) = tan 0 = 0 ,

como puede verse a medida que el ángulo  alpha , aumenta, aumenta el coseno  overline{OC} en el lado positivo de las x, el seno  overline{CB} disminuye en el lado negativo de las y, y la tangente  overline{ED} también disminuye en el lado negativo de las y.

Cuando  alpha , , vale  2 pi , ó  0 pi , al completar una rotación completa los puntos B, C y D, coinciden en E, haciendo que el seno y la tangente valga cero, y el coseno uno, del mismo modo que al comenzarse el primer cuadrante.

Dado el carácter rotativo de las funciones trigonométricas, se puede afirmar en todos los casos:

    operatorname {sen} ; alpha =    operatorname {sen}(alpha + 2 , pi , n )     cos alpha =    cos (alpha + 2 , pi , n )     tan alpha =    tan(alpha + 2 , pi , n )

Que cualquier función trigonométrica toma el mismo valor si se incrementa el ángulo un número entero de rotaciones completas.

 

[editar] Representación gráfica

Representación de las funciones trigonométricas en el plano (x,y), los valores en el eje x expresados en radianes.

[editar] Calculo de algunos casos

RelTri-1.svg

Partiendo de una circunferencia de radio uno, dividida en cuatro cuadrantes, por dos rectas perpendiculares, que se cortan en el centro de la circunferencia O, estas rectas cortan a la circunferencia en los puntos A, B, C y D, la recta horizonte AC también la podemos llamar eje x y la recta vertical BD eje y. Dada una recta r, que pasa por el centro de la circunferencia y forma un ángulo α con OA, eje x, y corta a la circunferencia en F, tenemos que la vertical que pasa por F corta al eje x en E, la vertical que pasa por A corta a la recta r en G. Con todo esto definimos, como ya se vio anteriormente, las funciones trigonométricas:

para el seno:

    sen ; alpha =    cfrac{; overline{EF} ;}{overline{OF}} =    overline{EF}

dado que:

    overline{OF} = 1

Para el coseno:

    cos ; alpha =    cfrac{; overline{OE} ;}{overline{OF}} =    overline{OE}

dado que:

    overline{OF} = 1

Para la tangente:

    tan ; alpha =    cfrac{; overline{EF} ;}{overline{OE}} =    cfrac{; overline{AG} ;}{overline{OA}} =    overline{AG}

dado que:

    overline{OA} = 1

partiendo de estas definiciones, podemos ver algunos caso importantes:

[editar] Para 90-α

RelTri-2.svg

Si a partir del eje vertical OB trazamos la recta r a un ángulo α en el sentido horario, la recta r forma con el eje x un ángulo 90-α, el valor de las funciones trigonométricas de este ángulo conocidas las de α serán:

El triángulo OEF rectángulo en E, siendo el ángulo en F α, por lo tanto:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = sen ; (90-alpha)       end{array}    right }    longrightarrow  quad    sen ; (90-alpha) = cos ; alpha

en el mismo triángulo OEF, tenemos que:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = cos ; (90-alpha)       end{array}    right }    longrightarrow  quad    cos ; (90-alpha) = sen ; alpha

viendo el triángulo OAG, rectángulo en A, siendo el ángulo en G igual a α, podemos ver:

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{OA} ;}{overline{AG}}           overline{OA} =1           overline{AG} = tan ; (90-alpha)       end{array}    right }    longrightarrow  quad    tan ; (90-alpha) = cfrac{1}{tan ; alpha}

[editar] Para 90+α

RelTri-3.svg

Si a partir de eje vertical OB trazamos la recta r a un ángulo α, medido en sentido trigonométrico, el ángulo formado por el eje horizontal OA y la recta r será 90+α. La prolongación de la recta r corta a la circunferencia en F y a la vertical que pasa por A en G.

El triángulo OEF es rectángulo en E y su ángulo en F es α, por lo tanto tenemos que:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = sen ; (90+alpha)       end{array}    right }    longrightarrow  quad    sen ; (90+alpha) = cos ; alpha

En el mismo triángulo OEF podemos ver:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = -cos ; (90+alpha)       end{array}    right }    longrightarrow  quad    cos ; (90+alpha) = -sen ; alpha

En el triángulos OAG rectángulo A y siendo α el ángulo en G, tenemos:

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{OA} ;}{overline{AG}}           overline{OA} =1           overline{AG} = -tan ; (90+alpha)       end{array}    right }    longrightarrow  quad    tan ; (90+alpha) = cfrac{-1}{tan ; alpha}

[editar] Para 180-α

RelTri-4.svg

Si sobre el eje horizontal OC, trazamos la recta r a un ángulo α, el ángulo entre el eje OA y la recta r es de 180-α, dado el triángulo OEF rectángulo en E y cuyo ángulo en O es α, tenemos:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = sen ; (180-alpha)       end{array}    right }    longrightarrow  quad    sen ; (180-alpha) = sen ; alpha

en el mismo triángulo OEF:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = -cos ; (180-alpha)       end{array}    right }    longrightarrow  quad    cos ; (180-alpha) = -cos ; alpha

En el triángulo OAG, rectángulo en A y con ángulo en O igual a α, tenemos:

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{AG} ;}{overline{OA}}           overline{OA} =1           overline{AG} = -tan ; (180-alpha)       end{array}    right }    longrightarrow  quad    tan ; (180-alpha) = -tan ; alpha

[editar] Para 180+α

RelTri-5.svg

Sobre la circunferencia de radio uno, a partir del eje OC con un ángulo α trazados la recta r, el ángulo del eje OA y la recta r es de 180+α, como se ve en la figura. En el triángulo OEF rectángulo en E se puede deducir:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = -sen ; (180+alpha)       end{array}    right }    longrightarrow  quad    sen ; (180+alpha) = -sen ; alpha

en el mismo triángulo OEF tenemos:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = -cos ; (180+alpha)       end{array}    right }    longrightarrow  quad    cos ; (180+alpha) = -cos ; alpha

en el triángulo OAG, rectángulo en A, vemos que:

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{AG} ;}{overline{OA}}           overline{OA} =1           overline{AG} = tan ; (180+alpha)       end{array}    right }    longrightarrow  quad    tan ; (180+alpha) = tan ; alpha

[editar] Para 270-α

RelTri-6.svg

Sobre el eje OD y con un ángulo α medido en sentido horario trazamos la recta r. El ángulo entre el eje OA y la recta r es de 270-α. En el triángulo OEF, rectángulo en E, tenemos:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = -sen ; (270-alpha)       end{array}    right }    longrightarrow  quad    sen ; (270-alpha) = -cos ; alpha

por otra parte en el mismo triángulo OEF, tenemos:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = -cos ; (270-alpha)       end{array}    right }    longrightarrow  quad    cos ; (270-alpha) = -sen ; alpha

en el triángulo OAG rectángulo en A, y siendo α el ángulo en G, tenemos;

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{OA} ;}{overline{AG}}           overline{OA} =1           overline{AG} = tan ; (270-alpha)       end{array}    right }    longrightarrow  quad    tan ; (270-alpha) = cfrac{1}{tan ; alpha}

[editar] Para 270+α

RelTri-7.svg

Sobre el eje OD y con un ángulo α medido en sentido trigonometrico, trazamos la recta r. El ángulo entre el eje OA y la recta r es de 270+α. En el triángulo OEF, rectángulo en E, tenemos:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = -sen ; (270+alpha)       end{array}    right }    longrightarrow  quad    sen ; (270+alpha) = -cos ; alpha

por otra parte en el mismo triángulo OEF, tenemos:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = cos ; (270+alpha)       end{array}    right }    longrightarrow  quad    cos ; (270+alpha) = sen ; alpha

en el triángulo OAG rectángulo en A, y siendo α el ángulo en G, tenemos;

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{OA} ;}{overline{AG}}           overline{OA} =1           overline{AG} = -tan ; (270+alpha)       end{array}    right }    longrightarrow  quad    tan ; (270+alpha) = cfrac{-1}{tan ; alpha}

[editar] Para -α

RelTri-8.svg

Sobre la circunferencia de radio uno, a partir del eje OA con un ángulo α medido en sentido horario trazados la recta r, el ángulo del eje OA y la recta r es de , o lo que es lo mismo 360-α como se ve en la figura. En el triángulo OEF rectángulo en E se puede deducir:

    left .       begin{array}{l}          sen ; alpha =cfrac{; overline{EF} ;}{overline{OF}}           overline{OF} =1           overline{EF} = -sen ; (-alpha)       end{array}    right }    longrightarrow  quad    sen ; (-alpha) = -sen ; alpha

en el mismo triángulo OEF tenemos:

    left .       begin{array}{l}          cos ; alpha =cfrac{; overline{OE} ;}{overline{OF}}           overline{OF} =1           overline{OE} = cos ; (-alpha)       end{array}    right }    longrightarrow  quad    cos ; (-alpha) = cos ; alpha

en el triángulo OAG, rectángulo en A, vemos que:

    left .       begin{array}{l}          tan ; alpha =cfrac{; overline{AG} ;}{overline{OA}}           overline{OA} =1           overline{AG} = -tan ; (-alpha)       end{array}    right }    longrightarrow  quad    tan ; (-alpha) = -tan ; alpha

[editar] Identidades trigonométricas

Artículo principal: Identidades trigonométricas

Una identidad es una igualdad en que se cumple para todos los valores permisibles de la variable. En trigonometría existen seis identidades fundamentales:

[editar] Recíprocas

 operatorname {sen} (alpha) cdot csc (alpha) = 1  operatorname {cos} (alpha) cdot sec (alpha) = 1  operatorname {tan} (alpha) cdot cot (alpha) = 1

[editar] De división

Trigono a00.svg
 tan (alpha) = frac {operatorname {sen} (alpha)}{ cos (alpha)}

[editar] Por el teorema de Pitágoras

Como en el triángulo rectángulo cumple la funcion que:

a^2 + b^2 = c^2 ,

de la figura anterior se tiene que:

 operatorname {sen} (alpha ) =  frac {a}{c}  cos (alpha ) =  frac {b}{c}  c = 1 ,

entonces para todo ángulo α, se cumple la identidad Pitagórica :

operatorname {sen}^2 alpha + cos^2 alpha = 1 ,

que también puede expresarse:

tan^2 alpha + 1 = sec^2 alpha , 1+cot^2 alpha = csc^2 alpha ,

[editar] Suma y diferencia de dos ángulos

operatorname {sen}(alpha + beta) = operatorname {sen} alpha cos beta + cos alpha operatorname {sen} beta ,

 

operatorname {sen}(alpha - beta) = operatorname {sen} alpha cos beta - cos alpha operatorname {sen} beta ,

 

cos(alpha + beta) = cos alpha cos beta - operatorname {sen} alpha operatorname {sen} beta ,

 

cos(alpha - beta) = cos alpha cos beta + operatorname {sen} alpha operatorname {sen} beta ,

 

 

tan(alpha + beta) = frac{tan alpha + tan beta}{1 - tan alpha tan beta}

 

tan(alpha - beta) = frac{tan alpha - tan beta}{1 + tan alpha tan beta}

[editar] Suma y diferencia del seno y coseno de dos ángulos

operatorname {sen} alpha + operatorname {sen} beta = 2operatorname {sen} left( frac{alpha + beta}{2}right)cos left(frac{alpha - beta}{2} right)

 

operatorname {sen} alpha - operatorname {sen} beta = 2operatorname {sen} left( frac{alpha - beta}{2}right)cos left(frac{alpha + beta}{2} right)

 

cos alpha + cos beta = 2cos left(frac{alpha + beta}{2} right)cos  left(frac{alpha - beta}{2}right)

 

cos alpha - cos beta = -2operatorname {sen} left(frac{alpha + beta}{2} right) operatorname {sen} left(frac{alpha - beta}{2}right)

[editar] Producto del seno y coseno de dos ángulos

cos(alpha) cos(beta) = frac{cos(alpha + beta) + cos(alpha - beta) }{ 2}operatorname {sen}(alpha) operatorname {sen}(beta) = frac{cos(alpha - beta) - cos(alpha + beta) }{ 2}operatorname {sen}(alpha) cos(beta) = frac{operatorname {sen}(alpha + beta) + operatorname {sen}(alpha - beta) }{ 2}cos(alpha) operatorname {sen}(beta) = frac{operatorname {sen}(alpha + beta) - operatorname {sen}(alpha - beta) }{ 2}

[editar] Ángulo doble

operatorname {sen} 2alpha = 2 operatorname {sen}alpha cdot cos alpha ,!

 

cos 2alpha = cos^2  alpha - operatorname {sen}^2 alpha ,!

 

cos 2alpha = 1 - 2 operatorname {sen}^2 alpha ,!

 

cos 2alpha = -1 + 2 cos^2 alpha ,!

 

tan 2alpha = frac{2tan alpha}{1 - tan^2 alpha}

 

operatorname {sen}^2 alpha = frac{1-cos 2alpha}{2}

 

cos^2 alpha = frac{1+cos 2alpha}{2}

[editar] Ángulo mitad

operatorname {sen}left(frac{alpha}{2} right) = sqrt{frac{1-cosalpha}{2}} ,!

 

cos left(frac{alpha}{2} right) = sqrt{frac{1+cosalpha}{2}} ,!

 

tan left(frac{alpha}{2} right) = sqrt{frac{1-cosalpha}{1+cosalpha}}

 

[editar] Otras identidades trigonométricas

operatorname {sen} left ( frac{pi}{2} - alpha right ) = cos alpha ,!cos left ( frac{pi}{2} - alpha right ) = operatorname {sen}alpha ,!operatorname {sen} (pi - alpha) = operatorname {sen}alpha ,!cos (pi - alpha) = - cos alpha ,!operatorname {sen} (2pi - alpha) = - operatorname {sen} alpha ,!cos (2pi - alpha) = cos alpha ,!operatorname {sen}alpha cdot cos alpha + operatorname {sen}beta cdot cos beta = operatorname {sen}(alpha + beta) cdot cos(alpha - beta)
Véase también: Sinusoide

[editar] Seno y coseno, funciones complejas

El seno y coseno se definen en matemática compleja, gracias a la fórmula de Euler como:

operatorname {sen} alpha= frac {e^{ialpha}-e^{-ialpha}}{2i}cos alpha= frac {e^{ialpha}+e^{-ialpha}}{2}

Por lo tanto, la tangente quedará definida como:

tan alpha =frac{1}{i} frac {e^{ialpha}-e^{-ialpha}}{e^{ialpha}+e^{-ialpha}} = {-i} frac {e^{ialpha}-e^{-ialpha}}{e^{ialpha}+e^{-ialpha}}

Siendo i=sqrt{-1} (también puede representarse como j).

[editar] Referencias

  1. «Etimología de la palabra "trigonometría"». Diccionario web de etimología (inglés).

[editar] Bibliografía

  1. Cortés Espinosa de los Monteros, Nuria. Ediciones Didácticas y Pedagógicas S. L.. ed. Actividades para unidad didáctica sobre trigonometría [Recurso electrónico] (2008). ISBN 978-84-936336-3-9. 
  2. Domínguez Muro, Mariano. Universidad de Salamanca. Ediciones Universidad Salamanca. ed. Trigonometría activa: 2 BUP (1985). ISBN 978-84-7800-056-2. 

[editar] Véase también

[editar] Enlaces externos

Wikilibros

31/10/2010 19:00 petalofucsia #. Matemáticas Hay 1 comentario.

MATEMÁTICAS: ¿CUÁLES SON LAS LEYES DE LA FORMA O LAS LEYES TRIGONOMÉTRICAS? Forma (Figura), el sentido más simple y probablemente originario de la palabra forma hace referencia a la figura espacial de los cuerpos materiales sólidos.

Forma (Figura)

De Wikipedia, la enciclopedia libre

Forma (Figura), el sentido más simple y probablemente originario de la palabra forma hace referencia a la figura espacial de los cuerpos materiales sólidos.

Pero la peculiaridad del término consiste en la abstracción que hacemos al prescindir de la materia de las cosas y considerar la figura en sí misma como algo independiente, es decir, como forma.

Así clasificamos los objetos según sus formas abstractas, cuadrados, círculos, esferas, etc. agrupándolos por lo que tienen de común sin tener en cuenta la materia o contenido que los diferencia.

Desde antiguo se encontraron las propiedades que atañen a las cosas en cuanto figuras espaciales naciendo la geometría como ciencia con carácter necesario, es decir de conocimiento conforme a leyes y principios generales.

Contenido

[ocultar]

[editar] Forma como aspecto visual y como estructura

La definición de forma en relación al lenguaje visual tiene una doble acepción, fundamentada en la realidad que las cosas muestran en su configuración, determinada, pues, por su apariencia.

  • Es la apariencia externa de las cosas
  • Es también su estructura expresiva plástica, donde se asienta su identidad visual

La primera se modifica según los condicionantes físicos de su percepción, como son la iluminación, el punto de vista, el sujeto observador, etcétera. La segunda es inmutable; en su esqueleto y armazón.

La forma es el contorno de un objeto sensible, la línea que precisa y aísla del medio ambiente la realidad física del objeto, lo que determina la diferencia y el modo de ser de los entes. Luego, la forma es, esencialmente cualidad y modo de ser del signo.

La forma penetra también en toda la organización de los cuerpos, haciéndose estructura y organismo. Se habla propiamente de forma refiriéndose al espacio interno; el espacio externo se denomina contraforma.

  • Forma.Es la representación gráfica de un objeto.

La forma es cualquier cosa, si se modifica no pasa nada porque aun sigue siendo una forma.

Se dice que cuando una forma se descompone en sus partes, pierde su configuración y se percibe como no configurada. Se dice que “la forma es un todo”, es algo más que la suma de sus partes. Si se alteran los elementos que la conforman, pierde significación.

  • Tamaño: el tamaño depende de la relación y comparación entre una forma y otra.

Así, pueden establecerse formas de mayor tamaño, si se compara con otra de tamaño menor. Se puede hablar de formas grandes y pequeñas cuando se trata de diferenciarlas dentro del contexto de una disposición y “forma constitutiva”.

  • Color: la forma puede percibirse gracias al color: generalmente, lo que se ve como forma no puede separarse de lo que se ve como color, pues el color en la forma es sencillamente la reacción de un objeto a los rayos de luz mediante los cuales lo percibimos. El color, junto con la textura, conforma el aspecto superficial de la forma.
  • Textura: se refiere a la apariencia externa de la forma que podemos percibir a través de la vista y el tacto, según el tratamiento que se le de a la superficie de la misma.

La textura en la forma puede recibir variaciones en cuanto al color; una forma de textura rugosa, si es tratada con el mismo color que otra de textura lisa, sufre alteraciones de su color porque hay más concentración de pigmentos y, por lo tanto, este se ve más intenso.

  • Posición: se relaciona más con el concepto de forma compositiva o composición y tienen que ver con la forma en el espacio. Cuando relacionamos la forma con el ámbito o campos donde se desarrolla la percepción visual, podemos determinar su posición. Los ejes dominantes establecen un marco de referencia en el mundo visual. Por ejemplo: horizontal o vertical, y también la dirección de la forma. La posición y la orientación de la forma dependen también de su organización en la composición.

[editar] Clasificación de las Formas

  • Formas Básicas / Geométricas Dibujo Artistico con Medrano

Son el círculo, el cuadrado y el triángulo equilátero. Cada una de ellas tiene sus propias características y son la base para la formación de nuevas obras. Las vemos en arquitectura y en la manufactura de nuevos objetos.

  • Formas Orgánicas o Naturales

Son aquellas que pertenecen a la naturaleza, a las que el hombre recurre, generalmente para sus creaciones artísticas.

  • Formas Artificiales

Son aquellas creadas o fabricadas por el hombre. El diseño de los automóviles, por ejemplo. Una silla, una mesa, etc.


a) Geométricas, construidas matemáticamente. b) Orgánicas, rodeadas por curvas libres que sugieren fluidez y desarrollo. c) Rectilíneas, limitadas por líneas rectas que no están relacionadas matemáticamente entre sí. d) Irregulares, limitadas por líneas rectas y curvas que no están relacionadas matemáticamente entre sí. e) Manuscritas, caligráficas o creadas a mano alzada. f) Accidentales, determinadas por el efecto de procesos o materiales especiales u obtenidas accidentalmente. Las formas planas pueden ser sugeridas por medio del dibujo.

[editar] Clases de forma

Formas Simbólicas: Tienen una significación que va más allá de lo que se representa. Algunas tienen significado patriótico, religiosos, poético, oníricos, sexuales, guerreros, de paz, etc. Estos significados están expresados en la forma o implícitos en ellas. Sin embargo, el observador necesita conocimiento de una clave o convención de las mismas. Un ejemplo de una forma simbólica es la bandera nacional.

  • Formas Abiertas y Cerradas: La forma abierta se percibe con mayor facilidad cuando se relacionan con el fondo, ya que una de sus características principales es que se integran a el o al medio. En la pintura, la forma abierta se expresa a través del poco contraste y el pase por medio del cual se funde con el fondo.

La forma cerrada se diferencia de la abierta por su contorno, por la continuidad del contraste con respecto al fondo. Podemos distinguirla cuándo observamos una obra pictórica o un diseño grafico. En la escultura y la arquitectura, la forma abierta se expresa por la interpretación de las mismas; no hay delimitación precisa entre exterior e interior, entre concavidad y convexidad.

  • Formas Abstractas: son aquellas que no representan algo concreto. Esta formas tienen belleza absoluta debido a que ninguna obra es igual que la otra.
  • Formas Figurativas: Son aquellas formas concretas usadas normalmente para expresar ideas de imágenes con formas existentes, pero las modifican en función de la composición.
  • Forma Simétrica: Las formas simétricas son aquellas de correspondencia exacta en forma, tamaño y posición de las partes de un todo. En la naturaleza encontramos una gran variedad de formas simétricas, también en obras artísticas encontramos simetría.

Según sus dimensiones, las formas son: bidimensionales y tridimensionales.

  • Forma Tridimensional: La forma tridimensional tiene volumen, masa y tres dimensiones: largo, ancho y profundidad; el espacio que ocupan es real. Se pueden ver de frente, de costado o por detrás; pueden tocarse. A menudo es posible verlas bajo diferentes condiciones de luminosidad y sus planos de observación son múltiples.
  • Formas Bidimensionales: Es plana, y como su nombre lo indica tiene dos dimensiones: ancho y largo. En las pinturas y en las fotos las formas son bidimensionales por que solo las percibimos del lado frontal.
  • Formas Positivas y Formas Negativas: Generalmente la forma se la ve como ocupante de un espacio, pero también puede ser vista como un espacio en blanco, rodeado de un espacio ocupado. Cuando ocupa el espacio se dice que es positiva. Cuando se percibe como un espacio en blanco, rodeado por un espacio ocupado es llamada negativa. En blanco y negro tendemos a considerar el espacio en blanco vacío y al negro ocupado, por lo tanto consideramos una forma negra positiva y una blanca negativa. Cuando estas se interrelacionan se vuelve más difícil distinguir una de la otra. La forma sea positiva o negativa es mencionada comúnmente como la figura que está sobre un fondo. Esta relación puede ser reversible.
  • Formas Ambiguas: Según nuestra organización perceptual, estas formas admiten varias interpretaciones. Las figuras o formas reversibles presentan cierta ambigüedad por que se perciben alternativamente las zonas correspondientes a figuras y fondos, positivos o negativos. Las figuras o formas imposibles se pueden dibujar, pero no se pueden construir en tres dimensiones; es decir, tienen un carácter bidimensional: al tratar de construirlas en tres dimensiones se desorganiza su configuración. Las figuras o formas virtuales se configuran por el efecto visual de cerramiento.
  • Forma Estilizada: Es una forma a su máxima simplicidad. Por lo general la complejidad del motivo se reduce a formas geometrizadas que caracterizan sus rasgos fundamentales.

Desde la prehistoria hasta nuestros días observamos algunas manifestaciones de formas estilizadas en obras artísticas, se usa también como un recurso muy valioso en las artes decorativas para la decoración de objetos y textiles y, en artes gráficas, para la confección de afiches y vallas con fines artísticos y publicitarios.

  • Forma Reversible: Son todas aquellas formas a las que se les puede interpretar de varias maneras. El cubo de Necker es un buen ejemplo de este tipo de forma.

[editar] Procesos de Elaboración de Formas

  • Rasgado: consiste en doblar una hoja de papel en cuatro partes y rasgar cualquier forma en el centro del papel. El resultado será la forma positiva y el fondo será la forma negativa. Luego se aplica pigmento negro a la zona positiva.
  • Disposición de Módulos Dimensionales: hemos recortado nueve cuadritos en cartulina de color y los hemos colocado en un formato, de modo que todos conforme un único bloque visual. Los cuadritos se han dispuesto de tal manera que la distancia que sea igual entre cada uno de ellos, para dar visión de un conjunto y lograr una forma.
  • Descomposición de la Forma: hemos recortado dos formas bidimensionales básicas, en este caso, dos cuadros y hemos efectuado en cada forma cuatro cortes de línea recta. Si colocamos las piezas de la primera forma sobre el soporte, separadas con una misma distancia, la forma cuadrada se conserva. En cambio al colocar las piezas de la segunda forma sobre el soporte, pero esta vez ordenadas de manera diferente, se obtiene la descomposición de la forma.
  • Construcción de Sólidos: se dibuja y se recorta en una cartulina el desarrollo de la forma deseada. En este caso hemos trabajado con un cubo. Al doblar cada una de sus caras y pegar con cola plástica las pestañas se obtiene una construcción sólida
  • Formas tridimensionales: para construir un sólido dibuja el desarrollo de la forma deseada ya sea cubo, cono, triángulo, etc. En cartulina de construcción recorta y dobla cada intercepción y procede a armarlo, pegando las aletas extremas.

[editar] Véase también

Forma (Filosofía)

[editar] Enlaces externos

31/10/2010 18:58 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿EN CUANTO A CORRELACIONES, DEBERÍAMOS DE ESTAR ORIENTADOS AL FUTURO?. En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase Cum hoc ergo propter hoc).

Correlación

De Wikipedia, la enciclopedia libre

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase Cum hoc ergo propter hoc).

 

[editar] Fuerza, sentido y forma de la correlación

La relación entre dos super variables cuantitativas queda representada mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:

  • La fuerza extrema segun el caso, mide el grado en que la línea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil.
  • El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al crecer los valores de A disminuyen los de B, la relación es negativa.

[editar] Coeficientes de correlación

Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos variables por el producto de sus desviaciones estándar. Otros coeficientes son:

[editar] Interpretación geométrica

Ambas series de valores X (x_1, ldots, x_n) e Y (y_1, ldots, y_n) pueden estar consideradas como vectores en un espacio a n dimensiones. Reemplacemoslos por vectores centrados:

X (x_1 - bar x, ldots, x_n - bar x) e Y (y_1 - bar y, ldots, y_n - bar y).


El coseno del ángulo alfa entre estos vectores es dada por la fórmula siguiente :

 cos(alpha) = dfrac{displaystyle sum_{i=1}^N (x_i - bar x)cdot(y_i - bar y)}{sqrt{displaystyle sum_{i=1}^N (x_i - bar x)^2}cdotsqrt{displaystyle sum_{i=1}^N (y_i - bar y)^2}}

Pues cos(α) es el coeficiente de correlación de Pearson.

¡El coeficiente de correlación es el coseno entre ambos vectores centrados!

Si r = 1, el ángulo α = 0°, ambos vectores son colineales (paralelos).Si r = 0, el ángulo α = 90°, ambos vectores son ortogonales.Si r =-1, el ángulo α = 180°, ambos vectores son colineales de dirección opuesto.Más generalmente : α = arcCos(r).

Por supuesto, del punto vista geométrica, no hablamos de correlación lineal: el coeficiente de correlación tiene siempre un sentido, cualquiera que sea su valor entre -1 y 1. Nos informa de modo preciso, no tanto sobre el grado de dependencia entre las variables, que sobre su distancia angular en la hiperesfera a n dimensiones.

La Iconografía de las correlaciones es un método de análisis multidimensional que reposa en esta idea.

la correlacion lineal se da cuando en una nube de puntos estos se encuentran o se distribuyen alrededor de una recta.

31/10/2010 18:31 petalofucsia #. Matemáticas Hay 1 comentario.

MATEMÁTICAS: EL NÚMERO UNO. El uno (1) es el número entero que sigue al cero y precede al dos.

Uno

De Wikipedia, la enciclopedia libre
Para otros usos de este término, véase Uno (desambiguación).
 
1
CardinalUno
OrdinalPrimero, -a
Primo, -a
Sistemas de numeración
RomanaI
ÁticaΙ
Jónicaα
China
China tradicional
Egipcia
Z1
ArmeniaԱ
Maya
CirílicaА
De los Campos de Urnas/
India
Sistema binario1
Sistema octal1
Sistema hexadecimal1
Como parámetro de una función
Función φ de Euler0
Función divisor1
Función de Möbius1
Función de Mertens1
cero1dos

El uno (1) es el número entero que sigue al cero y precede al dos.

Contenido

[ocultar]

[editar] Representacion

[editar] Propiedades matemáticas

  • El 1 se puede representar como el cociente de cualquier número distinto de cero entre sí mismo; o como el producto de cualquier número distinto de cero por su inverso:
x cdot frac{1}{x} = 1, x neq 0
  • El 1 es el elemento neutro del producto; es decir, cualquier número a multiplicado por 1 vuelve a dar a.
  • El 1 no se considera número primo por razones técnicas. Si lo fuera, entonces los números naturales no tendrían una factorización única (salvo orden), sino que tendrían infinitos factores (por ejemplo, 6 = 2 × 3 = 1 × 2 × 3 = 1 × 1 × 2 × 3 = ...) y las definiciones de muchas propiedades matemáticas se verían afectadas, como por ejemplo, los números perfectos.
  • El 1 es tanto el primer término como el segundo de la sucesión de Fibonacci. El siguiente término de la sucesión es el 2.
  • En informática, el 1 se asocia con la posición de "encendido" en lógica positiva y con la posición de "apagado" en lógica negativa, y es uno de los dos dígitos del sistema binario (el otro es el cero).

[editar] Características

  • Existen varios prefijos que significan uno, y participan en la construcción de una gran cantidad de palabras de uso cotidiano: mono y uni, como en monóculo y único.
  • En muchas culturas el 1 se representa mediante un punto o un trazo (horizontal, vertical o más o menos sinuoso). Por ejemplo, en la Números arábigos (1), en la romana (I), en la antigua numeración griega (I), en la numeración china (一), en la árabe (١), en la hangzhou (〡), en la bengalí (১), en la tibetana (༡), en la egipcia (
    Z1
    ), en la colombiana (8px) y en la Cultura de los Campos de Urnas (/).
  • En la simbología cristiana, el 1 simboliza la Unidad y el Principio Creador del que proceden todas las cosas.

[editar] Véase también

[editar] Enlaces externos



Predecesor:
2-1
Potencias de 2
20
Sucesor:
21
Predecesor:
10-1
Potencias de 10
100
Sucesor:
101
Predecesor:
10-3
Escala numérica larga
100
Sucesor:
103
31/10/2010 16:17 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: UNIDAD. El uno (1) es el número entero que sigue al cero y precede al dos.

Unidad

De Wikipedia, la enciclopedia libre

 

 

Unidad puede referirse a:

  • uno, el número entero, y conceptos matemáticos relacionados con él:
  • patrón de medida con divisiones y subdivisiones:
  • Otros
31/10/2010 16:15 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: NORMA VECTORIAL. Un vector es un elemento de un espacio vectorial del que, en ocasiones, especialmente en Física y Geometría, interesa conocer su longitud. Para ello se hace necesario definir un operador norma que determine la longitud o magnitud del vector bajo consideración ya que este acto, pese a lo que pudiéramos creer, no es un problema trivial; especialmente desde la aparición de las geometrías no euclídeas para las que aparece, asociada al concepto de longitud, la noción de geodésica. Para ampliar estas ideas conviene conocer la geometría riemanniana y la geometría diferencial.

Norma vectorial

De Wikipedia, la enciclopedia libre
¿SUBORDINACIÓN A LA NORMA? ¿SUBORDINACIÓN A LA UNIDAD?

Un vector es un elemento de un espacio vectorial del que, en ocasiones, especialmente en Física y Geometría, interesa conocer su longitud. Para ello se hace necesario definir un operador norma que determine la longitud o magnitud del vector bajo consideración ya que este acto, pese a lo que pudiéramos creer, no es un problema trivial; especialmente desde la aparición de las geometrías no euclídeas para las que aparece, asociada al concepto de longitud, la noción de geodésica. Para ampliar estas ideas conviene conocer la geometría riemanniana y la geometría diferencial.

Por tanto, basándonos en las propiedades básicas que la determinación de la longitud tiene en el espacio euclídeo habitual, definimos matemáticamente qué condiciones mínimas debe satisfacer un operador que actúe sobre un vector para poder ser considerado un operador norma en cualquier geometría. De esta forma, aparecen varias posibilidades que han sido muy fructíferas en diversos campos entre los que cabe destacar la Astrofísica y la Cosmología.

En espacios vectoriales es sinónimo de longitud de un vector.

Contenido

[ocultar]

[editar] Definición de norma euclídea

En un espacio euclídeo ordinario los vectores son representables como segmentos orientados entre puntos de dicho espacio. Dado un vector de un espacio vectorial euclídeo, la norma de un vector se define como la distancia (en línea recta) entre dos puntos A y B que delimitan dicho vector. De hecho, en un espacio euclídeo la norma de un vector coincide precisamente con el módulo del vector vec {AB}.

  • En dos dimensiones:
 | vec{AB} | = sqrt{(b_1 - a_1)^2 + (b_2 - a_2)^2} siendo vec{OA} = (a_1, a_2) y vec{OB} = (b_1, b_2) y O el origen de coordenadas de dicho espacio.
  • Extendiendo lo anterior al espacio euclídeo de tres dimensiones, es también elemental que:
 | vec {AB} | = sqrt{(b_1 - a_1)^2 + (b_2 - a_2)^2 + (b_3 - a_3)^2} siendo vec {OA} = (a_1, a_2, a_3) y vec {OB} = (b_1, b_2, b_3)
  • En el caso general de un espacio euclídeo de n dimensiones se tiene:
 | vec{AB} | = sqrt{(b_1 - a_1)^2 + (b_2 - a_2)^2 + ... + (b_n - a_n)^2} siendo vec {OA} = (a_1, a_2, ..., a_n) y vec {OB} = (b_1, b_2, ..., b_n) .

De lo anterior se sigue que, fijada una base ortonormal mathcal{B} en la que un vector mathbf{v} viene dado por sus componentes en esta base, mathbf{v}_mathcal{B} = (v_1,v_2,cdots,v_n), entonces la norma de dicho vector viene dada por:

|mathbf{v}| = sqrt{v_1^2+v_2^2+cdots+v_n^2}

[editar] Definición matemática general

La definición general de norma se basa en generalizar a espacios vectoriales abstractos la noción de módulo de un vector de un espacio euclídeo. Recuérdese que en un espacio no euclídeo el concepto de camino más corto entre dos puntos ya no es identificable con el de la línea recta; por ello, se utilizan las propiedades operacionales de la norma euclídea definida más arriba para extraer las condiciones que debe cumplir la "longitud de un vector", o norma vectorial, en un espacio vectorial cualquiera. Estas condiciones básicas son:

  • Siempre es no negativa e independiente del sentido (orientación) de la medición.
  • La longitud debe ser directamente proporcional al tamaño (es decir, doble -o triple- de tamaño significa doble -o triple- de longitud).
  • La longitud entre dos puntos será siempre menor o igual que la suma de longitudes desde esos mismos dos puntos a un tercero diferente de ellos (desigualdad triangular: la suma de dos lados de un triángulo nunca es menor que el tercer lado, también generalizada en la desigualdad de Cauchy-Schwarz).

Esto genera la siguiente definición matemática:

Sea  mathbf{V} un espacio vectorial sobre un cuerpo mathbb{K} y vec x un vector del espacio. Se dice que |.|:Vrightarrow mathbb{R} es un operador que define la norma de vec x, y escribimos |vec x|, si cumple:

  1. Para todo vec x de  mathbf{V} su norma ha de ser no negativa, y será cero si y sólo si vec x es el vector cero: 0 < |vec x| si vec x neq vec 0   y  |vec x| = 0 Longleftrightarrow vec x = vec 0 .
  2. Para todo vec x de  mathbf{V} y para todo k de mathbb{K} se satisface que |k vec x | = |k| · | vec x |
  3. Para todos vec x e vec y de mathbf{V} se cumple que  | vec {x} + vec {y} | leq | vec {x} | + | vec {y} | (desigualdad triangular).

Cualquier operador que cumpla estas tres condiciones, y en cualquier geometría, será un operador norma.

[editar] Ejemplos

A continuación se muestran algunos ejemplos de posibles operadores norma, que satisfacen la definición matemática general:

  • Para un vector vec x = (x_1,x_2,...,x_n) se define la norma-p como:

 | vec x |_p = sqrt[p]{|x_1|^p+|x_2|^p+...+|x_n|^p}

Así, para el caso p = 1 se obtiene | vec x |_1 = |x_1| + |x_2| + ... + |x_n| , y para el caso p = 2 se obtiene la norma euclídea explicada más arriba.

  • Otro operador norma sería, la norma del máximo:

| vec x |_infty = max(|x_1|,|x_2|,...,|x_n|) = max_{iin{1,dots,n}} |x_i|

Donde vec x = (x_1,x_2,...,x_n) . Para un espacio de dimensión finita numerable se podría escribir:

| vec x |_infty = sup_{iinmathbb{N}} |x_i|

La elección del subíndice infty para esta norma se debe al hecho de que:

 lim_{pto infty} , ,  | vec x |_p  = | vec x |_infty

|x| = sqrt{langle x , xrangle}

Si dicho espacio es un espacio de Hilbert entonces el espacio con la norma asociada al producto escalar es un espacio de Banach.

[editar] Véase también

31/10/2010 15:54 petalofucsia #. Matemáticas Hay 2 comentarios.

MATEMÁTICAS: CORRESPONDENCIA MATEMÁTICA. Dados dos conjuntos: X e Y, y un Grafo f, que determina alguna Relación binaria entre algún elemento de X con algún elemento de Y, diremos que ese grafo: f, define una correspondencia[1] entre X e Y, que representaremos: F:X- Y cuando al menos un elemento de X está relacionado con al menos un elemento de Y.

Correspondencia matemática

De Wikipedia, la enciclopedia libre
Correspondencia subtipos 02.svg

Dados dos conjuntos: X e Y, y un Grafo f, que determina alguna Relación binaria entre algún elemento de X con algún elemento de Y, diremos que ese grafo: f, define una correspondencia[1] entre X e Y, que representaremos:

 fcolon X rightarrow Y

cuando al menos un elemento de X está relacionado con al menos un elemento de Y.

Contenido

[ocultar]

[editar] Un ejemplo

Correspon 00.svgCorrespon 01.svg
Correspon 02.svgCorrespon 04.svg

Si tenemos una serie de objetos, como los tubos de pintura y los pinceles, y diferenciamos por un lado los tubos y por otro los pinceles, y asociamos a cada tubo el pincel que tiene el mismo color de pintura, tenemos una relación color de la pintura entre cada tubo y cada pincel que tenga el mismo color.

Correspon 20.svg
Correspon 21.svg
Correspon 22.svg
Correspon 23.svg
Correspon 24.svg
Correspon 25.svg

En este ejemplo, podemos definir un conjunto T de tubos de pintura y otro P de pinceles y asociar a cada tubo del conjunto T, el pincel del conjunto P que tenga su mismo color, esta asociación la representaremos con una flecha del tubo al pincel correspondiente.

Puede darse el caso que tengamos un tubo de un color pero no un pincel con el mismo color de pintura, como en el ejemplo hay un tubo de color rojo pero no hay ningún pincel con pintura de color rojo, por lo tanto del tubo rojo no sale ninguna flecha.

Puede que tengamos un tubo de un color y varios pinceles con pintura de ese mismo color, así en el ejemplo hay un tubo verde y dos pinceles con pintura verde, del tubo de color verde salen dos flechas una hasta cada pincel con pintura verde.

Correspon 0101.svg

También puede ser que tengamos más de un tubo de un mismo color y un solo pincel con esa pintura, en este caso, como en el ejemplo, de los dos tubos azules salen las dos flechas hasta el único pincel con pintura azul, llegando dos flechas al pincel azul, una de cada uno de los tubos de color azul, como se ve en la figura.

En la figura del ejemplo se ve un pincel con pintura amarilla, pero no hay ningún tubo de pintura amarilla, por tanto a este pincel no llega ninguna flecha.

En resumen la correspondencia mismo color de la pintura entre un conjunto T de tubos de pintura, y otro conjunto P de pinceles, existe en tanto en cuanto al menos un tubo de pintura tiene el mismo color que uno de los pinceles, pudiendo ser esa relación tan sencilla o tan compleja como se quiera.

En una correspondencia matemática los conjuntos no tienen que ser necesariamente numéricos, ni la relación entre sus elementos operaciones aritméticas, sin que por ello deje de ser matemática.

[editar] Definiciones

Correspondencia 01.svg
Correspon 0602.svg

En una correspondencia podemos distinguir distintos conjuntos:

  • Conjunto inicial: es el primero de la correspondencia, es este caso X, lo representaremos: in(f), según el ejemplo:
 X = {rm in}(f) = {1, 2, 3, 4 } ,

En el segundo ejemplo, tenemos una correspondencia entre un conjunto de pinceles P y un conjunto de caras C que hemos pintado con esos pinceles, la correspondencia asocia a cada pincel la cara del mismo color, en este ejemplo el conjunto inicial será:

 P = {rm in}(color) = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P1.svg } ,
  • Conjunto final: es el segundo de la correspondencia en este caso Y, lo representaremos como fin(f), según el ejemplo:
 Y = {rm fin}(f)= {a, b, c, d } ,

En el ejemplo de los pinceles y las caras el conjunto final está formado por:

 C = {rm fin}(color) = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C5.svg } ,
  • Conjunto origen: es el formado por los elementos del conjunto inicial, que están relacionados con algún elemento del conjunto final, lo representaremos or(f), en el ejemplo será:
 {rm or}(f)= {2, 3 } ,

Los pinceles de los que hay una cara pintada es el conjunto origen, de la correspondencia mismo color:

 {rm or}(color) = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg } ,
  • Conjunto imagen: es el formado por los elementos del conjunto final con los que están relacionados los elementos del conjunto origen, lo representaremos Im(f), en el ejemplo:
 {rm Im}(f) = { c, d } ,

Las caras para las que hay un pincel de su color es el conjunto imagen:

 {rm Im}(color) = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg } ,
  • Elementos homólogos: dos elementos, uno del conjunto origen y otro del conjunto imagen, se dice que son homólogos, si están relacionados según la correspondencia f, en el ejemplo los siguientes pares ordenadas son homólogos:
 (2, d), ; (3, c)

Los pares ordenados formados por un pincel y una cara del mismo color son:

 ( , Correspon P0.svg, Correspon C0.svg ) , ( , Correspon P2.svg, Correspon C2.svg ) , ( , Correspon P4.svg, Correspon C4.svg ) ,
  • Imagen de un elemento: dado un elemento x del conjunto origen, y otro elemento y del conjunto imagen, se dice que y es imagen de x y se representa:
 f(x) = y ,

si el elemento x está relacionado con el elemento y según la correspondencia f. en el ejemplo tenemos que:

 f(2) = d ,  f(3) = c ,

La correspondencia color por la que a cada pincel se le asocia la cara pintada del mismo color es:

 {rm color}( , Correspon P0.svg  ) = , Correspon C0.svg
 {rm color}( , Correspon P2.svg  ) = , Correspon C2.svg
 {rm color}( , Correspon P4.svg  ) = , Correspon C4.svg

[editar] Correspondencia definida a partir del producto cartesiano

Dados los conjuntos X (Conjunto inicial) e Y (Conjunto final) y definido el producto cartesiano  X times Y , de estos dos conjuntos, como el conjunto de pares ordenados (x, y), donde  x in X  e  y in Y  , dado el conjunto F que contiene a los pares homónimos de la correspondencia f, y  F subset ( X times Y ) define esa correspondencia en su totalidad.

Por lo tanto podemos decir que una correspondencia entre dos conjuntos X e Y, es un subconjunto F del producto cartesiano  X times Y , que recoge los pares ordenados (x, y), que forman la correspondencia.

[editar] ejemplo 1

d(1,d)(2,d)(3,d)(4,d)
c(1,c)(2,c)(3,c)(4,c)
b(1,b)(2,b)(3,b)(4,b)
a(1,a)(2,a)(3,a)(4,a)
X×Y1234

en la diagrama anterior, tenemos los conjuntos:

 X = {1, 2, 3, 4 } , Y = {a, b, c, d } ,

el producto  X times Y es:

 X times Y  = { , (1,a), , (1,b), , (1,c), , (1,d),  
   (2,a), , (2,b), , (2,c), , (2,d),  
   (3,a), , (3,b), , (3,c), , (3,d),
   (4,a), , (4,b), , (4,c), , (4,d)  } ,

el conjunto F es el siguiente:

 F = { ( 2, d ), ( 3, c ) } ,

se puede apreciar que  F subset ( X times Y ) y que F define la correspondencia en su totalidad.

[editar] ejemplo 2

Correspon 0601.svg

Partiendo de la correspondencia entre los tubos de pintura T, y los pinceles P, asociando a cada tubo el pincel que tiene pintura del mismo color.

La correspondencia vendrá definida por los pares ordenados:

 F = { ( , Correspon T0.svg, Correspon P0.svg ) , ( , Correspon T2.svg, Correspon P2.svg ) , ( , Correspon T4.svg, Correspon P4.svg ) } ,

Vemos que el conjunto inicial es:

 T = { , Correspon T0.svg,Correspon T2.svg,Correspon T4.svg,Correspon T5.svg } ,

y el conjunto final:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P1.svg } ,

 

Correspon P1.svgCorresCartesi 10.svgCorresCartesi 12.svgCorresCartesi 14.svgCorresCartesi 15.svg
Correspon P4.svgCorresCartesi 40.svgCorresCartesi 42.svgCorresCartesi 44.svgCorresCartesi 45.svg
Correspon P2.svgCorresCartesi 20.svgCorresCartesi 22.svgCorresCartesi 24.svgCorresCartesi 25.svg
Correspon P0.svgCorresCartesi 00.svgCorresCartesi 02.svgCorresCartesi 04.svgCorresCartesi 05.svg
 Correspon T0.svgCorrespon T2.svgCorrespon T4.svgCorrespon T5.svg

el producto cartesiano de T por P es el conjunto de pares ordenados de cada uno de los tubos de T con cada uno de los pinceles de P, en la cuadricula podemos ver en la fila inferior cada uno de los tubos del conjunto T, y en la columna da la izquierda cada uno de los pinceles del conjunto P, donde se cortan una fila y una columna están el tubo y el pincel correspondientes, se ha destacado el fondo de las pares que forman parte de la correspondencia.

[editar] Correspondencia inversa

Correspon 0601.svg
Correspon 0600.svg

Dada una correspondencia entre los conjuntos A y B, representada:

 f: A rightarrow B

se define como correspondencia inversa de f, que llamaremos  f^{-1} ,:

 f^{-1}: B rightarrow A

a la que asocia la imagen de la función f con su origen.

Definida una correspondencia F, como un subconjunto del producto cartesiano de  A times B , donde los pares ordenados (a, b) son los asociados por la correspondencia, la correspondencia inversa  F^{-1} ,, es el subconjunto del producto cartesiano  B times A , formado por los pares ordenados (b, a) obtenidos de cambiar el orden de la correspondencia F.

Así si tenemos un conjunto T de tubos de pintura y otro conjunto P de pinceles y asociamos por una relación f a cada tubo de T el pincel con pintura del mismo color:

 f: T rightarrow P

y esta función está definida por los pares ordenados:

 , (  Correspon T0.svg, Correspon P0.svg ) , , (  Correspon T2.svg, Correspon P2.svg ) , , (  Correspon T4.svg, Correspon P4.svg ) ,

La correspondencia inversa será la que partiendo del conjunto de pinceles P asocia a cada pincel el tubo del conjunto T de pintura del mismo color:

 f^{-1}: P rightarrow T

que estará definida por los pares ordenados:

 , (  Correspon P0.svg, Correspon T0.svg ) , , (  Correspon P2.svg, Correspon T2.svg ) , , (  Correspon P4.svg, Correspon T4.svg ) ,

[editar] Tipos de correspondencias

[editar] Clasificación según la unicidad

Conjuntos 04.svg

Partiendo de dos conjuntos, uno inicial X, y otro final Y, y todas las posibles correspondencias que se pueden hacer entre estos dos conjuntos, por su interés podemos diferenciar las correspondencias unívocas y biunívocas.

  • Una correspondencia es unívoca si cada elemento inicial solo tienen una imagen.
Informalmente: "si sólo sale una flecha de cada elemento del conjunto inicial que tenga imagen"
  • Una correspondencia es biunívoca si cada elemento inicial solo tienen una imagen, y cada elemento imagen solo tiene un origen.
Informalmente: "si sólo sale una flecha de cada elemento del conjunto inicial que tenga imagen y a cada elemento del conjunto final con origen sólo le llegue una flecha"

No es necesario en ninguno de los dos casos, que todos los elementos de X tengan una imagen, ni que todos los elementos de Y tengan un origen, claramente una correspondencia tiene que ser unívoca para poder ser biunívoca.

Si representamos con un rectángulo todas las posibles correspondencias entre los conjuntos X e Y, si el conjunto B es el de las correspondencias unívocas, y al A el de las biunívocas, en un Diagrama de Venn, se ve claramente que el conjunto de las correspondencias biunívocas es un subconjunto de las correspondencias unívocas.

[editar] Correspondencia no unívoca

Correspondencia 02.svg
  • Es la correspondencia en la que al menos uno de los elementos origen tiene dos o más imágenes. En el diagrama de Venn, son las correspondencias que no pertenecen a B: B’

Si el conjunto inicial es el de los alumnos de un centro escolar, y el conjunto final el de las asignaturas que se imparten en ese centro, la correspondencia de alumnos con asignaturas, no será unívoca cuando al menos un alumno estudia dos o más asignaturas.

En el diagrama de la figura el elemento 3 tiene dos imágenes b y c, esto hace que la correspondencia no sea unívoca, independientemente de la relación que tengan el resto de los elementos. Esta doble imagen para un único origen da lugar a que podamos decir:

 f(3) = b ,  f(3) = c ,

Siendo las dos expresiones ciertas.

[editar] Correspondencia unívoca

Artículo principal: Correspondencia unívoca
  • Es una correspondencia donde cada elemento del conjunto origen se corresponde con solo un elemento del conjunto imagen.

En el diagrama de Venn son las correspondencias que pertenecen a B.

[editar] Correspondencia unívoca, no biunívoca

Correspondencia 03.svg
  • Es la que a cada origen le corresponde una única imagen, pero no todas las imágenes tienen un único origen. En el diagrama de Venn, son las correspondencias que pertenecen a B pero no a A: B-A.

Si el conjunto inicial es el de las personas de una población, y el conjunto final el de los domicilios de esa población, la correspondencia de personas con domicilios, será unívoca pero no biunívoca cuando, cada persona viva en un único domicilio y en algún domicilio vivan varias personas.

La correspondencia representada en este diagrama es unívoca, pero no es biunívoca porque el elemento d, tiene dos orígenes: 1 y 2. Así tenemos que:

 f(1) = d ,  f(2) = d ,

esto hace que no sea una correspondencia biunívoca, aunque por el resto de las relaciones si pueda serlo.

[editar] Correspondencia biunívoca

Artículo principal: Correspondencia biunívoca

Es decir: cada elemento del conjunto origen se corresponde con solo un elemento del conjunto imagen, y cada elemento del conjunto imagen se corresponde con solo un elemento del conjunto origen.

En el diagrama de Venn son las correspondencias que pertenecen a A.

Ejemplos

Correspondencia 04.svg
  • En el diagrama de la figura se ve que:
 f(2) = a ,  f(3) = b ,  f(4) = d ,

siendo estas todas las relaciones de esta correspondencia. Los elementos origen tienen una única imagen, y los elementos imagen tienen un único origen, puede haber elementos sin imagen como el 1, y elementos sin origen como la c, pero esto no influye en la definición de biunicidad.

  • Si consideramos como conjunto origen el de personas, y por conjunto imagen el de automóviles, esta correspondencia será biunívoca cuando las personas que tienen automóvil tienen un solo automóvil, y cada automóvil tenga un solo propietario.
  • Se puede establecer una correspondencia biunívoca entre cada número natural con su cuadrado.
  • Otro ejemplo podría ser una correspondencia biunívoca entre cada estudiante con su número de legajo.
  • Una relación biunívoca muy utilizada e independiente de otros valores es la existente entre el valor de la propiedad termométrica utilizada y el valor numérico de la temperatura asignada. Esto es que cada valor de temperatura se corresponde únicamente con un valor de la escala del termometro y cada valor de la escala del termometro se corresponde únicamente con un valor de temperatura.

[editar] Aplicación matemática

Aplicación 2.svg
Artículo principal: Función matemática

Dada una correspondencia matemática entre todos los elementos del conjunto X con los elementos del conjunto Y, diremos que esta correspondencia: f, es una Aplicación [2] [3] [4] [5] entre X e Y, que suele llamarse función matemática[6] si los conjuntos inicial y final son numéricos y se represente:

 f: X rightarrow Y
  • Cuando:
  1. Todos los elementos de X están relacionados con elementos de Y.
  2. Cada elemento de X, está relacionado con un único elemento de Y.

Vulgarmente: todos los elementos del conjunto origen tienen flecha y sólo una

Esto es: una correspondencia matemática es una aplicación, si todos los elementos del conjunto inicial tienen una imagen y solo una imagen.

En el diagrama se pueden ver los conjuntos X e Y:

d(1,d)(2,d)(3,d)(4,d)
c(1,c)(2,c)(3,c)(4,c)
b(1,b)(2,b)(3,b)(4,b)
a(1,a)(2,a)(3,a)(4,a)
X×Y1234
 X = {1, 2, 3, 4 } , Y = {a, b, c, d } ,

Como se puede ver, a cada uno de los elementos de X le corresponde un único elemento de Y. El elemento a de Y no tiene origen y el elemento b tiene dos orígenes (el 1 y el 4), pero esto no afecta a la definición de aplicación como tipo de correspondencia.

 

[editar] Tipos de Aplicación matemática

Dados dos conjuntos X, Y, y todas las posibles aplicaciones que pueden formarse entre estos dos conjuntos, se pueden diferenciar los siguientes casos:

Conjuntos 01.svg
  • Si a cada imagen le corresponde un único origen, inyectiva.
Vulgarmente: "a cada elemento del conjunto final que tenga origen, le llega sólo una flecha"
  • Si la aplicación es sobre todo el conjunto final, sobreyectiva.
Vulgarmente: "si a todos los elementos del conjunto final les llega una flecha, al menos"

Además de estos dos casos característicos, una aplicación puede ser inyectiva y sobreyectiva simultáneamente, que se denominan biyectiva, o ninguna de ellas en cuyo caso no tiene un nombre especifico.

Vulgarmente: "en una aplicación biyectiva todos los elementos origen tienen una flecha y a todos los elementos imagen, les llega una sola flecha"

Vamos a representar los tipos de aplicaciones en un Diagrama de Venn, el conjunto universal U, representado por un rectángulo, es el de todas las posibles aplicaciones, el conjunto A es el de las aplicaciones inyectivas, y el conjunto B el de las sobreyectivas, esto nos permite ver los distintos tipos de aplicaciones de un modo gráfico.

[editar] Aplicación inyectiva y no sobreyectiva

Aplicación inyectiva y no sobreyectiva

Una aplicación inyectiva cada elemento imagen tendrá un único origen y una no sobreyectiva tendrá al menos un elemento del conjunto final que no tenga elemento origen.

En el diagrama de Venn corresponden a las aplicaciones que pertenecen a A y no pertenecen a B, esto es las que pertenecen a la diferencia de A y B: A-B.

En estas aplicaciones la cardinalidad de X es siempre menor que la de Y, esto es el conjunto Y tendrá mayor número de elementos que X cuando tratamos de compararlos.

[editar] Ejemplo

en el diagrama de la figura:

todos los elementos de Y, que tienen origen, tienen un único origen, esto hace que la aplicación sea inyectivael elemento d de Y, no tiene ningún origen por lo que esta aplicación no es sobreyectiva.
[editar] Segundo ejemplo
Correspon 1402.svg

Partiendo del conjunto de pinceles con pintura de colores:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg } ,

Sobre el conjunto de caras pintadas:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C1.svg } ,

Asociando cada pincel con la cara correspondiente:

Correspon 30.svg

Dado que cada pincel tiene una cara y solo una cara de su color esta correspondencia es una aplicación, como las caras que tiene pincel de su color, tienen un solo pincel de su color, la aplicación es inyectiva, y como la cara pintada de amarillo, no tiene ningún pincel de este color, la aplicación no es sobreyectiva.

[editar] Aplicación no inyectiva y sobreyectiva

Aplicación no inyectiva y sobreyectiva

Una aplicación no inyectiva tiene al menos un elemento imagen que tiene dos o más orígenes y una sobreyectiva todos los elementos del conjunto final tienen al menos un elemento origen.

En el diagrama de Venn corresponden a las aplicaciones que no pertenecen a A y si pertenecen a B, esto es las que pertenecen a la diferencia de B y A: B-A.

Para esta aplicación el conjunto X ha de tener mayor número de elementos que Y, la cardinalidad de X ha de ser mayor que la de Y.

[editar] Ejemplo

en el diagrama de la figura:

el elemento c de Y, tiene dos orígenes: el 3 y el 4, por lo que esta aplicación no es inyectiva.todos los elementos de Y, tienen origen, esto hace que la aplicación sea sobreyectiva.
[editar] Segundo ejemplo
Correspon 1502.svg

Igual que en el ejemplo anterior partiremos del conjunto de pinceles con pintura de colores:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P4.svg } ,

En este caso hay dos pinceles con pintura azul, pero a pesar de tener el mismo color de pintura son dos pinceles distintos.

Como conjunto final tenemos el conjunto de caras pintadas:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg } ,

Asociando cada pincel con la cara del mismo color, vemos que cada pincel tiene una cara pintada de su color y solo una, esto hace que la correspondencia sea una aplicación, la cara azul tiene dos pinceles de su mismo color, por lo que no es inyectiva, todas las caras tiene un pincel con su color, luego la aplicación es sobreyectiva.

[editar] Aplicación inyectiva y sobreyectiva (biyectiva)

Aplicación biyectiva

Si una aplicación es inyectiva y sobreyectiva simultáneamente, se denomina biyectiva. Por ser inyectiva los elementos que tienen origen tienen un único origen y por ser sobreyectiva todos los elementos del conjunto final tienen origen.

En el diagrama de Venn el conjunto A es el de las aplicaciones inyectiva y el conjunto B el de las aplicaciones sobreyectiva, las aplicaciones biyectiva, que son inyectiva y sobreyectiva, será la intersección de A y B.

Estas dos circunstancias dan lugar a que el conjunto X e Y tengan el mismo número de elementos, la cardinalidad de X es la misma que la de Y, esto tiene una gran importancia cuando se pretende comparar dos conjuntos:

  • Si dados dos conjuntos podemos encontrar una aplicación biyectiva entre ellos, podemos afirmar, que los dos conjuntos tienen el mismo número de elementos. La cardinalidad de X es igual a la de Y.
[editar] Ejemplo
f(x)= 2x

en el diagrama de la figura:

todos los elementos de Y, que tienen origen, tienen un único origen, esto hace que la aplicación sea inyectivatodos los elementos de Y, tienen origen, esto hace que la aplicación sea sobreyectiva.

Si tomaremos por conjunto inicial el conjunto de los números naturales:

 X = {1, 2, 3, ... } ,

y por conjunto final el de los números naturales pares:

 Y = {2, 4, 6, ... } ,

Podemos ver que la relación

 f: X rightarrow Y  f: x mapsto 2x

Por el que a cada número natural x de X, le asociamos un número par 2x de Y, se cumple:

  1. f: es una aplicación, dado que a cada uno de los valores x de X le corresponde un único valor 2x de Y.
  2. esta aplicación es inyectiva dado que a cada número par 2x de Y le corresponde un único valor x de X.
  3. y es sobreyectiva porque todos los números pares tienen un origen

Esto nos permite afirmar que hay el mismo número de números naturales que de números naturales pares, se da la paradoja de que los números naturales pares en un subconjunto propio de los números naturales, esta circunstancia solo se da con los conjuntos infinitos.

[editar] Segundo ejemplo
Correspon 1602.svg

Tomando el conjunto de pinceles como conjunto inicial:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P1.svg } ,

y el de caras como conjunto final:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C1.svg } ,

La correspondencia que asocia cada pincel con la cara de su mismo color es una aplicación porque todos los pinceles tienen una cara con su color y solo una cara de ese color, la aplicación es inyectiva porque un pincel corresponde con una sola cara, y es sobreyectiva porque todas las caras tiene un pincel de su color, al ser inyectiva y sobreyectiva simultáneamente esta aplicación es biyectiva.

Una aplicación biyectiva hace corresponder los elementos del conjunto inicial con los del conjunto final uno a uno, pudiéndose decir que hay el mismo número de elementos en el conjunto inicial que en el final.

[editar] Aplicación no inyectiva y no sobreyectiva

Aplicación no inyectiva y no sobreyectiva

Una aplicación no inyectiva tendrá al menos un elemento imagen que tenga dos o más orígenes y una no sobreyectiva tendrá al menos un elemento del conjunto final que no tenga elemento origen. Este tipo de aplicaciones no tiene un nombre especifico y quizá sean las que presenten, desde el punto de vista matemático, un menor interés.

Para esta aplicación los conjuntos X e Y no son comparables, y no podemos plantear ningún supuesto sobre su cardinalidad, partiendo de su comparación, ni sobre su número de elementos.

En el diagrama de Venn corresponden a las aplicaciones que no pertenecen a A y no pertenecen a B, esto es las que no pertenecen a la unión de A y B.

[editar] Ejemplo

en el diagrama de la figura:

el elemento b de Y, tiene dos orígenes: 1 y 2, esto hace que esta aplicación no sea inyectivael elemento a de Y, no tiene ningún origen por lo que esta aplicación no es sobreyectiva
[editar] Segundo ejemplo
Correspon 1302.svg

Si tomamos como conjunto inicial el de pinceles de colores:

 P = { , Correspon P0.svg,Correspon P2.svg,Correspon P4.svg,Correspon P4.svg } ,

y como conjunto final el de caras coloreadas:

 C = { , Correspon C0.svg,Correspon C2.svg,Correspon C4.svg,Correspon C1.svg } ,

Vemos que todos los pinceles tiene una cara y solo una cara de su mismo color, luego esta correspondencia es una aplicación matemática.

Como la cara azul tiene dos pinceles de su color la aplicación no es inyectiva, y como la cara amarilla no tiene ningún pincel de ese color no es sobreyectiva, luego esta aplicación es no inyectiva y no sobreyectiva.

[editar] Véase también

[editar] Bibliografia

  1. Gutiérrez Gómez, Andrés; García Castro, Fernando (1981) (en español). Álgebra lineal (1 edición). Ediciones Pirámide, S.A.. ISBN 978-84-368-0174-3. 

[editar] Referencia

  1. Hurtado, F. (2 de 1997) (en español). Atlas de matemáticas (1 edición). Idea Books, S.A.. pp. 8. ISBN 978-84-8236-049-2. 
  2. Neila Campos (1 de 2003). «ÁLGEBRA LINEAL» (en español) págs. INTRODUCCIÓN: APLICACIONES ENTRE CONJUNTOS..
  3. F. Zotes (9 de 2009). «Cardinalidad de conjuntos» (en español) págs. I. Aplicaciones..
  4. Hurtado, F. (2 de 1997) (en español). Atlas de matemáticas (1 edición). Idea Books, S.A.. pp. 8. ISBN 978-84-8236-049-2. 
  5. Thomas Ara, Luis (9 de 1974). «Tema IV Aplicaciones» (en español). Algebra Lineal. Mª E. Rios Garcia (2 edición). AUTOR-EDITOR 15. pp. 38-54. ISBN 978-84-400-7995-4. 
  6. Gutiérrez Gómez, Andrés; García Castro, Fernando (1981). «3.2. Aplicaciones o funciones» (en español). Álgebra lineal (1 edición). Ediciones Pirámide, S.A.. pp. 131. ISBN 978-84-368-0174-3. 

[editar] Enlaces externos

Correspondencia matemáticaCONJUNTOS, APLICACIONES Y RELACIONES BINARIAS.Aplicaciones matemáticas
28/10/2010 13:11 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: RAZÓN (MATEMÁTICAS). En matemáticas, una razón es una relación entre dos números semejantes (es decir, objetos, personas, estudiantes, cucharadas, unidades idénticas de cualquier dimensión), generalmente se expresa como "a es a b" o a:b, a veces se expresa aritméticamente como un cociente adimensional de los dos, que indica de manera explícita las veces que el primer número contiene el segundo.

Razón (matemáticas)

De Wikipedia, la enciclopedia libre
Para otros usos de este término, véase Razón (desambiguación).
«ratio» redirige aquí. Para los coeficientes usados en economía y finanzas, véase ratio financiero.

En matemáticas, una razón es una relación entre dos números semejantes (es decir, objetos, personas, estudiantes, cucharadas, unidades idénticas de cualquier dimensión), generalmente se expresa como "a es a b" o a:b, a veces se expresa aritméticamente como un cociente adimensional de los dos, que indica de manera explícita las veces que el primer número contiene el segundo.

Contenido

[ocultar]

[editar] Razón geométrica

La razón entre el ancho y la altura de un típico monitor de computadora.

La razón geométrica es la comparación de dos cantidades por su cociente, en donde se ve cuántas veces contiene una a la otra. Es necesario tener el dominio o rango para poder sacarla.

Ejemplo: 18 entre 6 es igual a 3 (18 tiene tres veces seis); su razón geométrica es 3.

La razón se puede escribir de 3 formas Ejemplo A. 50 sobre 70 B. 50 es a 70 C. 50: 70 El numerador de la razón se llama antecedente debido a que puede haberse dividido o multiplicado.

[editar] Razón aritmética

La razón aritmética de dos cantidades es la diferencia (o resta) de dichas cantidades. La razón aritmética se puede escribir colocando entre las dos cantidades el signo . o bien con el signo -. Así, la razón aritmética de 6 a 4 se escribe: 6.4 ó 6-4.

color{red}{antecedenterightarrow 6}color{black}{-}color{blue}{4leftarrow consecuente}

El primer término de una razón aritmética recibe el nombre de antecedente y el segundo el de consecuente. Así en la razón 6-4, el antecedente es 6 y el consecuente 4.

[editar] Propiedades de las razones Aritméticas

Como la razón aritmética de dos cantidades no es más que la resta indicada de dichas cantidades, las propiedades de las razones aritméticas serán las propiedades de toda suma o resta.

PRIMERA PROPIEDAD

Si al antecedente se le suma o resta una cantidad la razón aritmética queda aumentada o disminuida dicha cantidad.

  • Primer caso (con la suma)
Sea la razón aritmética 7 a 5 es igual a 2:

 7-5=2,  o , 7.5=2

Si le sumamos al antecedente el número 4 (aclaramos que puede ser cualquier número) entonces tendríamos (7+4)-5= 6. Como se observa la respuesta de la razón aritmética original (7-5=2), después de sumarle 4 al antecedente ((7+4)-5= 6) la respuesta queda aumentada en dicha cantidad.
  • Segundo caso (con la resta)
Sea la razón aritmética 18 a 3 es igual a 15:

 18-3=15,  o , 18.3=15

Si le restamos al antecedente el número 2 (aclaramos que puede ser cualquier número) entonces tendríamos (18-2)-3= 13. Como se observa la respuesta de la razón aritmética original (18-3=15), después de restarle 2 al antecedente ((18-2)-3= 13) la respuesta queda disminuida en dicha cantidad.

SEGUNDA PROPIEDAD

Si al consecuente de una razón aritmética se suma o se resta una cantidad cualquiera, la razón queda disminuida en el primer caso y aumentada en el segundo en la cantidad de veces que indica dicho número.

  • Primer caso (sumando una cantidad cualquiera al consecuente)
Sea la razón aritmética 45 a 13 es igual a 32:Si le sumamos al consecuente el número 7 (aclaramos que puede ser cualquier número) entonces tendríamos 45-(13+7)=25. Como se observa la respuesta de la razón aritmética original (45-13=32), después de sumarle 7 al consecuente 45-(13+7)=25) la respuesta queda disminuida en dicha cantidad es decir de 32 paso a ser 25.
  • Segundo caso (restando una cantidad cualquiera al consecuente)
Sea la razón aritmética 36 a 12 es igual a 24:Si le restamos al consecuente el número 3 (aclaramos que puede ser cualquier número) entonces tendríamos 36-(12-3)= 27. Como se observa la respuesta de la razón aritmética original (36-12=24), después de restarle 3 al consecuente (36-(12-3)= 27) la respuesta queda aumentada en dicha cantidad es decir de 24 paso a ser 27.

[editar] Proporciones Aritméticas

Una "proporción aritmética" es la = de 2 razones. Las proporciones aritméticas se pueden representar de dos maneras distintas:

  • a/b = c/d o bien
  • a:b = c:d

y se lee "a es a b como c es a d".

Los términos primero y cuarto de una proporción aritmética reciben el nombre de extremos, mientras que los términos segundo y tercero se denominan medios. Los términos primero y tercero reciben el nombre de antecedentes, mientras que los términos segundo y cuarto se llaman consecuentes.

Así sea la proporción aritmética 10:5 = 8:4. Los términos 10 y 4 (son extremos) y, 5 y 8 (son medios).

Las proporciones aritméticas cuyos medios no son iguales reciben el nombre de proporciones aritméticas discretas. Por el contrario, si los medios de la proporción aritmética son iguales, ésta recibe el nombre de continua. En el caso del ejemplo se trata de una proporción aritmética discreta porque sus medios son desiguales (5 y 8).

En toda proporción (no continua):

  • El producto de los extremos será igual al producto de los medios.

(10×4 = 5×8)

Se define la media aritmética de una proporción aritmética continua como cada uno de los medios iguales de dicha proporción aritmética. Sea: 10-8::8-6. La media aritmética es 8.

La media aritmética de una proporción aritmética es igual a la semisuma de los extremos.

La razón geométrica de dos números es el cociente exacto de dividir el primero a por el segundo b y se representa:

a:b

Se lee "a" es a "b" como "c" es a "d"

Donde el a, b son entero, fraccionario o mixto (desde el punto de la aritmética).

Las razones se pueden escribir de tres maneras diferentes:

Ejemplo:

2 es a 202:1 /12/1

Por lo tanto toda razón se puede expresar como una fracción y eventualmente como un decimal.

[editar] Véase también

26/10/2010 10:57 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: RAZONES Y CARTESIANISMO. COORDENADAS CARTESIANAS. El plano cartesiano es un sistema de referencia respecto ya sea a un solo eje (línea recta), respecto a dos ejes (un plano) o respecto a tres ejes (en el espacio), perpendiculares entre sí (plano y espacio), que se cortan en un punto llamado origen de coordenadas. En el plano, las coordenadas cartesianas (o rectangulares) x e y se denominan abscisa y ordenada, respectivamente.

Coordenadas cartesianas

De Wikipedia, la enciclopedia libre

El plano cartesiano es un sistema de referencia respecto ya sea a un solo eje (línea recta), respecto a dos ejes (un plano) o respecto a tres ejes (en el espacio), perpendiculares entre sí (plano y espacio), que se cortan en un punto llamado origen de coordenadas. En el plano, las coordenadas cartesianas (o rectangulares) x e y se denominan abscisa y ordenada, respectivamente.

Cartesian-coordinate-system.svg

Contenido

[ocultar]

[editar] Historia

Se denominan coordenadas cartesianas en honor a René Descartes (1596-1650), el célebre filósofo y matemático francés que quiso fundamentar su pensamiento filosófico en la necesidad de tomar un «punto de partida» sobre el que edificar todo el conocimiento.

Como creador de la geometría analítica, Descartes también comenzó tomando un «punto de partida», el sistema de referencia cartesiano, para poder representar la geometría plana, que usa sólo dos rectas perpendiculares entre sí que se cortan en un punto denominado «origen de coordenadas», ideando las denominadas coordenadas cartesianas.

[editar] Sistema de coordenadas lineal

Un punto cualquiera de una recta puede asociarse y representarse con un número real, positivo si está situado a la derecha de un punto O, y negativo si está a la izquierda. Dicho punto se llama centro de coordenadas O (letra O) y se asocia al valor 0 (cero).

Corresponde a la dimensión uno, que se representa con el eje X, en el cual se define un centro de coordenadas, simbolizado con la letra O (de origen) y un vector unitario en el sentido positivo de las x: mathbf{i}.

Este sistema de coordenadas es un espacio vectorial de dimensión uno, y se le pueden aplicar todas las operaciones correspondientes a espacios vectoriales. También se le llama recta real.

Sistema de coordenadas en la recta.

Un punto:

A= ({x_A}),

también puede representarse:

 vec {OA}= x_A,mathbf{i}

La distancia entre dos puntos A y B es:

d_{AB} = |x_A - x_B| ,

[editar] Sistema de coordenadas plano

Con un sistema de referencia conformado por dos rectas perpendiculares que se cortan en el origen, cada punto del plano puede "nombrarse" mediante dos números: (x, y), que son las coordenadas del punto, llamadas abscisa y ordenada, respectivamente, que son las distancias ortogonales de dicho punto respecto a los ejes cartesianos.

Sistema de coordenadas cartesianas.

La ecuación del eje x es y = 0, y la del eje y es x = 0, rectas que se cortan en el origen O, cuyas coordenadas son, obviamente, (0, 0).

Se denomina también abscisa al eje x, y ordenada al eje y. Los ejes dividen el espacio en cuatro cuadrantes en los que los signos de las coordenadas alternan de positivo a negativo (por ejemplo, las dos coordenadas del punto A serán positivas, mientras que las del punto B serán ambas negativas).

Las coordenadas de un punto cualquiera vendrán dadas por las proyecciones del segmento entre el origen y el punto sobre cada uno de los ejes.

Sobre cada uno de los ejes se definen vectores unitarios (i y j) como aquellos paralelos a los ejes y de módulo (longitud) la unidad. En forma vectorial, la posición del punto A se define respecto del origen con las componentes del vector OA.

 overline{OA} = x_A , mathbf{i} + y_A  , mathbf{j}

La posición del punto A será:

 A = ( x_A , , y_A )

Nótese que la lista de coordenadas puede expresar tanto la posición de un punto como las componentes de un vector en notación matricial.

La distancia entre dos puntos cualesquiera vendrá dada por la expresión:

d_{overline{AB}} = sqrt{(x_B - x_A)^2 + (y_B - y_A)^2} ,

Aplicación del teorema de Pitágoras al triángulo rectángulo ABC.

Un vector cualquiera AB se definirá restando, coordenada a coordenada, las del punto de origen de las del punto de destino:

 overline{AB} = (x_B - x_A) , mathbf{i} + (y_B - y_A), mathbf{j}

Evidentemente, el módulo del vector AB será la distancia dAB entre los puntos A y B antes calculada.

[editar] Sistema de coordenadas espacial

Si tenemos un sistema de referencia formado por tres rectas perpendiculares entre sí (X, Y, Z), que se cortan en el origen (0, 0, 0), cada punto del espacio puede nombrarse mediante tres números: (x, y, z), denominados coordenadas del punto, que son las distancias ortogonales a los tres planos principales: los que contienen las parejas de ejes YZ, XZ e YX, respectivamente.

coordenadas cartesianas espaciales.

Los planos de referencia XY (z = 0); XZ (y = 0); e YZ (x = 0) dividen el espacio en ocho cuadrantes en los que, como en el caso anterior, los signos de las coordenadas pueden ser positivos o negativos.

La generalización de las relaciones anteriores al caso espacial es inmediata considerando que ahora es necesaria una tercera coordenada (z) para definir la posición del punto.

    overline{OA} =    x_A , mathbf{i} +    y_A , mathbf{j} +    z_A , mathbf{k}

Las coordenadas del punto A serán:

    A = ( x_A , , y_A , , z_A )

y el B:

    B = ( x_B , , y_B , , z_B )

La distancia entre los puntos A y B será:

    d_{overline{AB}} =    sqrt{       (x_B - x_A)^2 +       (y_B - y_A)^2 +        (z_B - z_A)^2    } ,

El segmento AB será:

    overline{AB} =    (x_B - x_A) , mathbf{i} +    (y_B - y_A) , mathbf{j} +    (z_B - z_A) , mathbf{k}

[editar] Cambio del sistema de coordenadas

Tanto en el caso plano como en el caso espacial pueden considerarse tres transformaciones elementales: traslación (del origen), rotación (alrededor de un eje) y escalado.

[editar] Traslación del origen

Traslación del origen en coordenadas cartesianas.

Suponiendo un sistema de coordenadas inicial S1 con origen en O y ejes x e y

 S1 = {O;; x,y }

y las coordenadas de un punto A dado, sean en el sistema S1:

 A = (x_A ,; y_A )

dado un segundo sistema de referencia S2

 S2 = {O^prime ;; x^prime,y^prime }

Siendo los centros de coordenadas de los sistemas 0 y , puntos distintos, y los ejes x, ; e y, paralelos dos a dos, y las coordenadas de , respecto a S1:

 O^prime = (x_{O^prime} , ; y_{O^prime})

Se dice traslación del origen, a calcular las coordenadas de A en S2, según los datos anteriores, que llamaremos:

 A^prime = (x^prime_A ,; y^prime_A )

Dados los puntos O, y A, tenemos la suma de vectores:

 overline{OA} = overline{O O^prime} + overline{O^prime A}

despejando

 overline{O^prime A} = overline{OA} - overline{O O^prime}

Lo que es lo mismo que:

 (x^prime_A ,; y^prime_A ) = (x_A ,; y_A ) - (x_{O^prime} , ; y_{O^prime})

Separando los vectores por coordenadas:

 x^prime_A = x_A - x_{O^prime}  y^prime_A = y_A - y_{O^prime}

y ampliándolo a tres dimensiones:

 z^prime_A = z_A - z_{O^prime}

[editar] Rotación alrededor del origen

Rotación alrededor del origen en coordenadas cartesianas.

Dado un sistema de coordenadas en el plano S1 con origen en O y ejes x e y:

 S_1 = { O; ; x,y }

y una base ortonormal de este sistema:

 B_1 = { mathbf{i} , mathbf{j} }

Un punto A del plano se representará en este sistema según sus coordenadas:

 mathbf{A} = x_A,mathbf{i} +y_A,mathbf{j}

Para un segundo sistema S2 de referencia girado un ángulo alpha , , respecto al primero:

S_2 ={ O; ; x^prime , y^prime }

y con una base ortonormal:

mathbf B_2 = { mathbf{i^prime} , mathbf{j^prime} }

Al cálculo de las coordenadas del punto A, respecto a este segundo sistema de referencia, girado respecto al primero, se llama rotación alrededor del origen, siendo su representación:

 {mathbf A^prime} = x^prime_A , mathbf{i^prime} + y^prime_A , mathbf{j^prime}

Hay que tener en cuenta que el punto  mathbf A , y  mathbf A^prime , son el mismo punto,  mathbf A equiv mathbf A^prime ; se emplea una denominación u otra para indicar el sistema de referencia empleado. El valor de las coordenadas respecto a uno u otro sistema, sí son diferentes, y es lo que se pretende calcular.

La representación de B1 en B2 es:

 mathbf{i} = cos {alpha} , mathbf{i^prime} - sin {alpha} , mathbf{j^prime}  mathbf{j} = sin {alpha} , mathbf{i^prime} + cos {alpha} , mathbf{j^prime}

Dado que el punto A en B1 es:

 mathbf {A} = x_A , mathbf{i} + y_A , mathbf{j}

con la transformación anterior tenemos:

 mathbf {A} = x_A ,(cos {alpha} , mathbf{i^prime} - sin {alpha} , mathbf{j^prime}) + y_A , (sin {alpha} , mathbf{i^prime} + cos {alpha} , mathbf{j^prime})

Y, deshaciendo los paréntesis:

 mathbf {A} = x_A , cos {alpha} , mathbf{i^prime} - x_A , sin {alpha} , mathbf{j^prime} + y_A , sin {alpha} , mathbf{i^prime} + y_A , cos {alpha} , mathbf{j^prime}

reordenando:

 mathbf {A} = (x_A , cos {alpha}+ y_A , sin {alpha}) , mathbf{i^prime} +(- x_A , sin {alpha} + y_A , cos {alpha}) , mathbf{j^prime}

Como:

 mathbf A equiv A^prime ;

Tenemos que:

 mathbf {A^prime} = (x_A , cos {alpha} + y_A , sin {alpha}) , mathbf{i^prime} +(- x_A , sin {alpha} + y_A , cos {alpha}) , mathbf{j^prime}

Como sabíamos:

 mathbf {A^prime} = x^prime_A , mathbf{i^prime} + y^prime_A , mathbf{j^prime}

Por identificación de términos:

 x^prime_A = ; x_A , cos {alpha} + y_A , sin {alpha}  y^prime_A = - x_A , sin {alpha} + y_A , cos {alpha}

Que son las coordenadas de A en B2, en función de las coordenadas de A en B1 y de  {alpha} , .

[editar] Escalado

Sea un punto con coordenadas (x,y) en el plano. Si se cambia la escala de ambos ejes en un factor λ, las coordenadas de dicho punto en el nuevo sistema de coordenadas pasarán a ser:

(x',y') = (lambda x,lambda y),

El factor de escala λ no necesariamente debe ser el mismo para ambos ejes.

[editar] Cálculo matricial

Siendo [T] la matriz de transformación y cuyas filas son precisamente las componentes de los vectores unitarios i ' y j ' respecto de los originales i y j, o si se prefiere, cuyas columnas son las componentes de los vectores unitarios originales en el sistema de referencia rotado.

Matriz de transformación (rotación).png

Nota: Las magnitudes vectoriales están en negrita.

[editar] Véase también

[editar] Enlaces externos

26/10/2010 10:54 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: TEORÍA DEL ORDEN. La teoría del orden es una rama de la matemática que estudia varias clases de relaciones binarias que capturan la noción intuitiva del orden matemático. Este artículo da una introducción detallada a este campo e incluye algunas de las definiciones más básicas. Para una rápida búsqueda de un término orden teórico, hay también un glosario de teoría del orden. Una lista de asuntos sobre orden recoge los artículos que existen en relación a esta teoría del orden.

Teoría del orden

De Wikipedia, la enciclopedia libre

La teoría del orden es una rama de la matemática que estudia varias clases de relaciones binarias que capturan la noción intuitiva del orden matemático. Este artículo da una introducción detallada a este campo e incluye algunas de las definiciones más básicas. Para una rápida búsqueda de un término orden teórico, hay también un glosario de teoría del orden. Una lista de asuntos sobre orden recoge los artículos que existen en relación a esta teoría del orden.

Contenido

[ocultar]

[editar] Trasfondo y motivación

El orden aparece por todas partes - por lo menos, si se trata de matemática y áreas relacionadas tales como la informática. El primer orden que uno típicamente encuentra en la educación matemática de la escuela primaria es el orden ≤ de los números naturales. Este concepto intuitivo es fácilmente extendido a otros conjuntos de números, tal como los enteros y reales. De hecho la idea de ser mayor o menor que otro número es una de las intuiciones básicas de los sistemas de numeración en general (que uno generalmente se interesa también en la diferencia real de dos números, que no viene dada por el orden). Otro ejemplo popular de un orden es el orden lexicográfico de las palabras en un diccionario.

Los tipos antedichos de orden tienen una propiedad especial: cada elemento se puede comparar con cualquier otro elemento, es decir es o mayor, o menor, o igual. Sin embargo, esto no siempre es un requisito deseable. Un ejemplo bien conocido es el orden de los subconjuntos de un conjunto. Si un conjunto contiene los elementos de cierto otro conjunto, entonces se puede decir que es menor o igual. Con todo, hay conjuntos que pueden no ser comparables de este modo, puesto que cada uno puede contener algún elemento que no esté presente en el otro. Por lo tanto, inclusión de subconjuntos es un orden parcial, en comparación con los órdenes totales dados antes.

Alentadas por los amplios usos prácticos de los órdenes, se pueden definir numerosas clases especiales de conjuntos ordenados, algunas de las cuales han llegado a ser campos matemáticos por sí mismos. Además, la teoría del orden no se restringe a las varias clases de relaciones de orden, sino que también considera funciones apropiadas entre ellas. Un ejemplo simple de una propiedad orden teórica viene del análisis donde encontramos con frecuencia a las funciones monótonas.

[editar] Introducción a las definiciones básicas

Esta sección tiene como objetivo dar una primera guía al reino de los conjuntos ordenados. Está dirigida al lector que tiene un conocimiento básico teoría de conjuntos y aritmética y que sabe qué es una relación binaria, pero que no está familiarizado, hasta ahora, con consideraciones teóricas sobre orden.

[editar] Conjuntos parcialmente ordenados

Como ya se hizo alusión arriba, un orden es una relación binaria especial. Por lo tanto consideremos algún conjunto P y una relación binaria ≤ en P. Entonces ≤ es un orden parcial si es reflexiva, antisimétrica, y transitiva, es decir, para todo a, b y c en P, tenemos que:

aa (reflexividad)si ab y bc entonces ac (transitividad)si ab y ba entonces a = b, (antisimetría).

Un conjunto con un orden parcial se llama conjunto parcialmente ordenado, o, en breve, poset (del inglés partially ordered set). El término conjunto ordenado a veces también se utiliza para los posets, mientras esté claro del contexto que no se quiere significar ninguna otra clase de órdenes. Comprobando esta propiedad, se ve inmediatamente que los bien conocidos órdenes de los naturales, enteros, racionales y reales son todos órdenes en el antedicho sentido. Sin embargo, tienen la propiedad adicional de ser total, es decir, para todo a, b en X

ab o ba (totalidad)

este orden se puede también llamar orden lineal o cadena. mientras que muchos órdenes clásicos son lineales, el orden entre subconjuntos de un conjunto proporciona un ejemplo donde éste no es el caso. De hecho, muchas propiedades avanzadas de los posets son interesantes principalmente para un orden no lineal.

[editar] Visualizando órdenes

Antes de proceder con más ejemplos y definiciones, será provechoso poder exhibir un orden de una manera gráfica conveniente, para proporcionar un "cuadro" que uno pueda tener en mente (o en papel) cuando se intente acceder a conceptos más abstractos. Para este propósito se han introducidos los, así llamados, diagramas de Hasse. Estos son grafos donde los vértices son los elementos del poset y la relación de orden está indicada por las aristas y la posición relativa de los vértices. Los órdenes se dibujan de abajo hacia arriba: si un elemento x es menor que y entonces existe una trayectoria de x hasta y que se dirige hacia arriba. A menudo es necesario que la conexión entre puntos se intersequen, pero los puntos nunca deben ser situados en conexión directa entre otros dos puntos.

Aún los conjuntos infinitos pueden a veces ser ilustrados por diagramas similares, usando puntos suspensivos (...) después de dibujar un suborden finito que sea lo suficientemente instructivo. Esto funciona bien para los números naturales, pero falla para los reales, donde no existe el inmediato sucesor. Sin embargo, frecuentemente se obtiene una intuición relacionada con diagramas de este tipo.

Todos los órdenes antedichos son muy comunes en matemática, sin embargo hay también ejemplos que uno no considera a menudo como órdenes. Por ejemplo, la relación de identidad "=" en un conjunto es un orden parcial. Dentro de este orden, cualesquiera dos (i.e. distintos) elementos son incomparables. Es también la única relación que es un orden parcial y una relación de equivalencia. El diagrama de Hasse de tal orden discreto es solamente una colección de puntos etiquetados, sin ninguna arista entre ellos.

Otro ejemplo viene dado por la relación de divisibilidad "|". Para dos números naturales n y m, escribimos n|m si n divide a m sin resto. Uno ve fácilmente que esto da realmente un orden parcial. Un ejercicio instructivo es dibujar el diagrama de Hasse para el conjunto de los números naturales que son menores o iguales que, digamos, 13, ordenados por |.

[editar] Elementos especiales dentro de un orden

En un conjunto parcialmente ordenado hay algunos elementos que desempeñan un papel especial. El ejemplo más básico está dado por el mínimo de un poset. Por ejemplo, 0 es el mínimo de los números naturales y el conjunto vacío es el mínimo bajo el orden de subconjuntos. Formalmente, esto se puede describir por la propiedad:

0 ≤ a, para todo elemento a del conjunto ordenado.

Es frecuente encontrar la notación 0 para el mínimo, incluso cuando no se refiera a números. Sin embargo, en un orden de un conjunto numérico, esta notación puede ser inadecuada o ambigua, puesto que el número 0 no siempre es el mínimo. Un ejemplo es el antedicho orden de divisibilidad |, donde 1 es el mínimo puesto que divide a todo el resto de números. Por otra parte, 0 es un número que se divide por todo el resto de números. ¡Por lo tanto es el máximo del orden! Otros términos frecuentes para estos elementos son fondo y tapa o cero y uno. Pueden no existir los elementos "mínimo" o "máximo", como demuestra el ejemplo de los números reales. Por otra parte, si existen son siempre únicos. En contraste, consideremos la relación de divisibilidad | en el conjunto {2, 3, 4, 5, 6}. Aunque este conjunto no tiene ni tapa ni fondo, los elementos 2, 3, y 5 no tienen ningún elemento debajo, mientras que 4, 5, y 6 no tienen ninguno otro número arriba. Tales elementos se llaman minimales y maximales, respectivamente. Formalmente, un elemento m es minimal si:

am implica a = m, para todo elemento a.

Intercambiando ≤ con ≥ obtenemos la definición de maximal. Como el ejemplo demuestra, puede haber muchos elementos minimales o maximales y algún elemento puede ser maximal y minimal (e.g. 5 arriba). Sin embargo, si hay un elemento mínimo, entonces es el único elemento minimal del orden. (Si se sigue estrictamente la definición dada. Lamentablemente hay una tradición matemática "a contrario": considerar los minimales y maximales en el conjunto despojado de su máximo y su mínimo, si los hubiere. Esto debe recordarse. N.T.). Una vez más, en los posets no siempre hay infinitos elementos maximales - el conjunto de todos los subconjuntos finitos en un conjunto infinito dado, ordenado por inclusión de subconjuntos, proporciona uno, entre muchos, contraejemplo. Una herramienta importante para asegurar la existencia de elementos maximales bajo ciertas condiciones es el Lema de Zorn.

Los subconjuntos de un conjunto parcialmente ordenado heredan el orden. Ya aplicamos esto al considerar el subconjunto {2, 3, 4, 5, 6} de los números naturales con el orden de divisibilidad inducido. Hay también elementos de un poset que son especiales con respecto a cierto subconjunto del orden. Esto conduce a la definición de cota superior. Dado un subconjunto S de cierto poset P, una cota superior de S es un elemento b de P que está sobre todo elemento de S. Formalmente, esto significa que

sb, para todo s en S.

Cota inferior se define invirtiendo el orden. Por ejemplo, -5 es una cota inferior de los números naturales como subconjunto de los enteros. Dado un conjunto de conjuntos , una cota superior para éstos conjuntos viene dado por su unión. De hecho, esta cota superior es muy especial: es el más pequeño conjunto que contiene todos los conjuntos dados. Por lo tanto, encontramos la menor cota superior de un conjunto de conjuntos. Este concepto se llama también supremo y para un conjunto S se escribe sup S o VS para su menor cota superior. Inversamente, la mayor cota inferior se la conoce como ínfimo y se denota inf S o ^S. Este concepto desempeña un papel importante en muchos usos de la teoría del orden. Para dos elementos x y y, uno también escribe x v y y x ^ y para sup{x, y} e inf{x, y}, respectivamente.

Usando Wikipedia TeX markup, uno puede también escribir vee y wedge, así como símbolos grandes bigvee y bigwedge. Observe, sin embargo, que todos esos símbolos pueden no tener símbolo de tamaño correspondiente al de la fuente del texto estándar y, por tanto, se prefiere utilizarlos en líneas adicionales. Muchos de los navegadores de hoy son incapaces de representar ∨ para v y ∧ para ^ en algunas plataformas, y por lo tanto se evita aquí.

Considere otro ejemplo en la relación | para los números naturales. La menor cota superior de dos números es el menor número que es múltiplo de ambos, es decir el mínimo común múltiplo. Mayor cota inferior es, alternativamente, el máximo común divisor.

[editar] Dualidad

En las anteriores definiciones, a menudo, observamos que un concepto puede ser definido por invertir simplemente el orden en una definición anterior. Este es el caso para "menor" y "mayor", para "mínimo" y "máximo", para "cota superior " y "cota inferior", etcétera. Esto es una situación general en teoría de orden: Un orden dado se puede invertir con solamente intercambiar su dirección, pictóricamente dar vuelta el diagrama de Hasse de arriba para abajo. Esto da el, así llamado, orden dual, inverso u opuesto.

Cada definición orden teórica tiene su dual: es la noción que se obtiene al aplicar la definición al orden inverso. Dada la simetría de todos los conceptos, esta operación preserva los teoremas del orden parcial. Para un resultado matemático dado, se puede, simplemente, invertir el orden y substituir todo definición por su dual y obtener otro teorema válido. Esto es importante y útil, puesto que uno obtiene dos teoremas al precio de uno. Más detalle y ejemplos se pueden encontrar en el artículo sobre dualidad en teoría de orden.

[editar] Construyendo nuevos órdenes

Hay muchas maneras de construir órdenes, o para combinar órdenes en uno nuevo. El orden dual es un primer ejemplo. Otra importante construcción es el producto cartesiano de dos conjuntos parcialmente ordenados, junto con el orden producto en pares de elementos. Esto se define por los órdenes originales haciendo (a, x) ≤ (b, y) si ab y xy. La unión disjunta de dos posets es otra típica construcción, donde el orden es exactamente la unión de los órdenes originales.

Como en el caso del orden usual de números, cada orden parcial ≤ da lugar a un orden estricto <, al definir a < b si ab y no ba. Esta transformación puede ser invertida haciendo ab si a < b o a = b.

[editar] Funciones entre órdenes

Es razonable requerir que las funciones entre conjuntos parcialmente ordenados tengan ciertas propiedades adicionales, que se relacionen con la relación de orden de los dos conjuntos. La condición más fundamental que se presenta en este contexto es la monotonía. Un función f de un poset P a un poset Q es monótona u orden preservante, si ab en P implica f(a) ≤ f(b) en Q. La conversa de esta implicación conduce a una función que es orden reflectante, es decir una función f como arriba para la cuál f(a) ≤ f(b) implica ab. Por otra parte, una función puede también ser orden inversora o antítona, si ab implica f(a) ≥ f(b).

Una inmersión de orden es una función f entre órdenes que es orden preservante y orden reflectante. Ejemplos para esta definición se encuentran fácilmente. Por ejemplo, función que mapea un número natural en su sucesor es claramente monótona con respecto al orden natural. Cualquier función de un orden discreto, es decir un conjunto ordenado por el orden identidad "=", es también monótono. Mapear cada número natural al correspondiente número real da un ejemplo para una inmersión de orden. El complemento conjuntista en un conjunto de partes es un ejemplo de una función antítona.

Una importante pregunta es cuándo dos órdenes son "esencialmente iguales", es decir cuándo son lo mismo salvo retitular elementos. Un isomorfismo de orden es una función que define tal renombrar. Un isomorfismo de orden es una función monótona biyectiva que tiene una inversa monótona. Esto es equivalente a una inmersión de orden sobreyectiva. Por lo tanto, la imagen f(P) de una inmersión de orden es siempre isomorfa a P, lo que justifica el término "inmersión".

Un más elaborado tipo de función es la, así llamada, conexión de Galois. Conexiones de Galois monótonas pueden ser vistas como una generalización de los isomorfismos de orden, puesto que están constituidas por dos funciones en inversa dirección, que no son inversas absolutas una de la otra, pero tienen cercana relación.

Otro tipo especial de endofunción en un poset es el operador de clausura, que no solamente es monotónico, sino también idempotente, es decir. f(x) = f(f(x)), y extensivo, es decir. xf(x). éste tiene mucho uso en todo clase de "clausuras" que aparecen en matemática.

Además de compatible con la mera relación de orden, una función entre posets puede también comportarse bien con respecto a elementos especiales y construcciones. Por ejemplo, cuando se habla de posets con menor elemento, parece razonable considerar solamente una función monotónica que preserve este elemento, es decir que mapee menor elemento en menor elemento. Si el ínfimo binario ^ existe, entonces una propiedad razonable puede ser requerir que f(x^y) = f(x) ^ f(y), para todo x y y. Todas estas propiedades, y de hecho muchas más, pueden ser agrupadas bajo la etiqueta función que preserva límite.

Finalmente, uno puede invertir la visión, cambiar funciones de orden a orden de funciones. De hecho, las funciones entre dos posets P y Q pueden ser ordenadas vía el orden punto a punto. Para dos funciones f y g, se tiene fg si f(x) ≤ g(x) para todo elemento x en P. Esto ocurrirá por ejemplo en teoría de dominios, donde los espacios funcionales desempeñan un importante papel.

[editar] Tipos especiales de orden

Muchas de las estructuras que son estudiadas en teoría de orden emplean relaciónes con propiedades adicionales. De hecho, algunas relaciones que no son de orden parcial son de especial interés. Principalmente, el concepto de preorden tiene que ser mencionado. Un preorden es una relación que es reflexiva y transitiva, pero no necesariamente antisimétrica. Cada preorden induce una relación de equivalencia entre elementos, donde a es equivalente a b, si ab y ab. Los preórdenes pueden ser convertidos en órdenes identificando todo elemento equivalente con respecto a esta relación.

Tipos básicos de órdenes especiales ya se dieron en forma de orden total. Una simple pero útil propiedad adicional conduce al, así llamado, buen orden, dentro del que todo subconjunto no vacío tiene un menor elemento (también denominado primer elemento). Muchos otros tipos de orden se presentan cuando se garantiza la existencia de ínfimos y supremos de ciertos conjuntos. Centrándose en este aspecto, generalmente referido como completitud de órdenes, se obtiene:

  • Posets acotados, es decir posets con menor y mayor elementos (que son precisamente supremo e ínfimo del conjunto vacío),
  • reticulados, en que cada conjunto finito no vacío tiene supremo e ínfimo,

Sin embargo, uno puede ir incluso más allá: si todo ínfimo finito no vacío existe, entonces ^ puede ser visto como una operación binaria total en el sentido del álgebra universal. Por lo tanto, en un reticulado, dos operaciones ^ y v están disponibles, y se puede definir nuevas propiedades dando identidades, tal como

x ^ (y v z) = (x ^ y) v (x ^ z), para todo x, y, y z.

Este condición se llama distributividad y dar lugar a los reticulados distributivos. Hay algunas otras importantes leyes de distributividad que son discutidas en el artículo sobre la distributividad en teorías de orden. Algunas estructuras de orden adicionales que son a menudo especificadas vía operación algebraica y definiendo identidades son

en que ambas introducen una nueva operación ~ llamada negación. Ambas estructuras desempeñan un papel en lógica matemática y especialmente las álgebras de Boole tienen importante uso en informática. Finalmente, varias estructuras en matemática combinan orden con operaciones aún más algebraicas, como el caso de quantales, que permite la definición de una operación de adición.

Existen muchas otras importantes propiedades de los posets. Por ejemplo, un poset es localmente finito si cada intervalo cerrado [a, b] en él es finito. Los posets localmente finitos dan lugar a álgebras de incidencia que alternadamente pueden ser utilizadas para definir característica de Euler de posets finitos acotados.

[editar] Subconjuntos de conjuntos ordenados

En un conjunto ordenado, uno puede definir muchos tipos especiales de subconjuntos basados en el orden dado. Un ejemplo simple son los conjuntos superiores, es decir conjuntos que contienen todo elemento que esté sobre ellos en el orden. Formalmente, la clausura superior de un conjunto S en un poset P viene dado por el conjunto {x en P| hay algún y en S con yx}. Un conjunto que es igual a su clausura superior se llama un conjunto superior. conjunto inferior es definido dualmente.

Subconjuntos inferiores más complicados son los ideales, que tienen la propiedad adicional que cada dos de sus elementos tiene cota superior dentro del ideal. Su noción dual son los filtros. Un concepto relacionado es el de subconjunto dirigido, que como un ideal contiene cota superior de un subconjunto finito, pero no tiene porque ser un conjunto inferior. Además, a menudo se generaliza a conjuntos preordenados.

Un subconjunto que es - como sub-poset - linealmente ordenado, se llama una cadena. La noción opuesta, anticadena, es un subconjunto que no contiene ningún par de elementos comparables, es decir que es un orden discreto.

[editar] Áreas matemáticas relacionadas

aunque la mayoría de las áreas matemáticas usan orden de uno u otra manera, también hay algunas teorías que tienen una relación que va mucho más allá de la mera utilización. Junto con su importante punto de contacto con la teoría de orden, algunas serán presentadas abajo.

[editar] Álgebra universal

Según lo ya mencionado, los métodos y el formalismo del álgebra universal son una herramienta importante para muchas consideraciones orden teóricas. Aparte de formalizar órdenes en términos de estructuras algebraicas que satisfacen ciertas identidades, se pueden también establecer otras conexiones con el álgebra. Un ejemplo es la correspondencia entre las álgebras de Boole y los anillos de Boole. Otros aspectos tienen que ver con la existencia de construcciones libres, tal como los reticulados libres basados en un conjunto de generadores. Además, los operadores de clausura son importantes en el estudio del álgebra universal.

[editar] Topología

En topología el orden desempeña un muy prominente papel. De hecho, el conjunto de los abiertos proporciona un clásico ejemplo de un reticulado completo, más exactamente un álgebra de Heyting completa (o "marco" o "locale"). Los filtros y las redes son nociones relacionadas con la teoría de orden y el operador clausura conjuntista puede ser utilizado para definir una topología. Más allá de esta relación, la topología de puede mirar únicamente en términos del reticulado de conjuntos abiertos, que conduce al estudio de la topología sin puntos. Además, un preorden natural de elementos del conjunto subyacente de una topología viene dada por el, así llamado, orden de especialización, que es realmente un orden parcial si la topología es T0.

Inversamente, en teoría de orden, uno a menudo hace uso de resultados topológicos. Hay varias maneras de definir subconjuntos de un orden que pueden ser considerados como conjunto abiertos de una topología. Especialmente, es interesante considerar topologías en un poset (X, ≤) que reobtiene ≤ como su orden de especialización. La más fina de tales topologías es la topología de Alexandrov, dada al tomar todos los conjuntos superiores ("upper") como abiertos. Inversamente, la más gruesa topología que induce el orden de especialización es la topología superior, que tiene los complementos de los ideales principales (es decir conjuntos de la forma { y en X|yx} para cada x) como una subbase. Adicionalmente, una topología con orden de especialización ≤ puede ser orden consistente, significando que sus conjuntos abiertos son "inaccesibles por supremos dirigidos" (con respecto ≤). La topología más fina de un orden consistente es la topología de Scott, que es más gruesa que la topología de Alexandrov. Una tercera topología importante en esta línea es la topología de Lawson. Hay cercanas conexiones entre estas topologías y los conceptos de la teoría de orden. Por ejemplo, una función preserva supremos dirigidos si y sólo si es continuo con respecto a la topología de Scott (por este razón esta propiedad orden teórica es también llamada continuidad de Scott).

[editar] Teoría de categorías

La visualización de órdenes con diagramas de Hasse tiene una generalización directa: en vez exhibir elemento menores bajo los mayores, la dirección del orden se puede también representar dando la dirección de las aristas del grafo. De esta manera, cada orden se ve como equivalente a un grafo dirigido acíclico, donde los nodos son los elementos del poset y hay una trayectoria dirigida de a a b si y solamente si ab. Eliminando el requisito acíclico, uno puede también obtener todos los preórdenes.

Cuando es equipado con todas las aristas transitivas, estos grafos son solamente categorías especiales, donde los elementos son los objetos y cada conjunto de morfismos entre dos elementos es a lo sumo un singletón. Funciones entre órdenes se convierten en funtores entre categorías. Interesantemente, muchas ideas de la teoría de orden son simplemente pequeñas versiones de los conceptos de la teoría de las categorías. Por ejemplo, un ínfimo es precisamente un producto categórico. Más en general, uno puede subsumir supremos e ínfimos bajo la noción abstracta de un límite categórico (o colímite, respectivamente). Otro lugar en donde las ideas categoriales surgen es el concepto de una conexión de Galois (monótona), que es precisamente igual a un par de funtores adjuntos.

Pero la teoría de las categorías también tiene un impacto en la teoría de orden de mayor escala. Clases de posets con funciones apropiadas según lo discutido arriba forman interesantes categorías. A menudo uno puede también establecer construcción de órdenes, como el orden producto, en término de categoría. Otras intuiciones resultan cuando categorías de orden resultan equivalentes categóricas a otra categoría, por ejemplo de espacios topológicos. Este línea de investigación conduce a varios teoremas de representación, a menudo recogidos bajo la etiqueta dualidad de Stone.

[editar] Esquema de temas relacionados

Teoría del orden
 
Bien ordenado
Orden total
Parcialmente ordenado
Preordenado
Relación reflexiva
Relación transitiva
Relación antisimétrica
Relación total
Orden bien fundamentado
 

[editar] Referencias

  • G. Gierz, K. H. Hofmann, K. Keimel, J. D. Lawson, M. Mislove, and D. S. Scott, Continuous Lattices and Domains, In Encyclopedia of Mathematics and its Applications, Vol. 93, Cambridge University Press, 2003. ISBN 0-521-80338-1
23/10/2010 19:09 petalofucsia #. Matemáticas Hay 1 comentario.

MATEMÁTICAS: MATRIX (MATHEMATICS). Matrices are a key tool in linear algebra. One use of matrices is to represent linear transformations, which are higher-dimensional analogs of linear functions of the form f(x) = cx, where c is a constant; matrix multiplication corresponds to composition of linear transformations. Matrices can also keep track of the coefficients in a system of linear equations. For a square matrix, the determinant and inverse matrix (when it exists) govern the behavior of solutions to the corresponding system of linear equations, and eigenvalues and eigenvectors provide insight into the geometry of the associated linear transformation.

Animatrix (アニマトリックス Animatorikkusu?) es una serie de cortos animados al estilo anime del mundo de ficción de la trilogía The Matrix. Animatrix en sí es un recopilación de 9 cortos creados por famosos dibujantes japoneses, entre estos cortos destaca lo variado en gráficos y originalidad en las historias, basadas en la trilogía estadounidense mencionada.

Obtenido de http://es.wikipedia.org/wiki/The_Animatrix

 

Matrix (mathematics)

From Wikipedia, the free encyclopedia
Jump to: navigation, search
Specific entries of a matrix are often referenced by using pairs of subscripts.

In mathematics, a matrix (plural matrices, or less commonly matrixes) is a rectangular array of numbers, such as

 begin{bmatrix} 1 & 9 & 13  20 & 55 & 4 end{bmatrix}.

An item in a matrix is called an entry or an element. The example has entries 1, 9, 13, 20, 55, and 4. Entries are often denoted by a variable with two subscripts, as shown on the right. Matrices of the same size can be added and subtracted entrywise and matrices of compatible sizes can be multiplied. These operations have many of the properties of ordinary arithmetic, except that matrix multiplication is not commutative, that is, AB and BA are not equal in general. Matrices consisting of only one column or row define the components of vectors, while higher-dimensional (e.g., three-dimensional) arrays of numbers define the components of a generalization of a vector called a tensor. Matrices with entries in other fields or rings are also studied.

Matrices are a key tool in linear algebra. One use of matrices is to represent linear transformations, which are higher-dimensional analogs of linear functions of the form f(x) = cx, where c is a constant; matrix multiplication corresponds to composition of linear transformations. Matrices can also keep track of the coefficients in a system of linear equations. For a square matrix, the determinant and inverse matrix (when it exists) govern the behavior of solutions to the corresponding system of linear equations, and eigenvalues and eigenvectors provide insight into the geometry of the associated linear transformation.

Matrices find many applications. Physics makes use of matrices in various domains, for example in geometrical optics and matrix mechanics; the latter led to studying in more detail matrices with an infinite number of rows and columns. Graph theory uses matrices to keep track of distances between pairs of vertices in a graph. Computer graphics uses matrices to project 3-dimensional space onto a 2-dimensional screen. Matrix calculus generalizes classical analytical notions such as derivatives of functions or exponentials to matrices. The latter is a recurring need in solving ordinary differential equations. Serialism and dodecaphonism are musical movements of the 20th century that use a square mathematical matrix to determine the pattern of music intervals.

A major branch of numerical analysis is devoted to the development of efficient algorithms for matrix computations, a subject that is centuries old but still an active area of research. Matrix decomposition methods simplify computations, both theoretically and practically. For sparse matrices, specifically tailored algorithms can provide speedups; such matrices arise in the finite element method, for example.

Contents

[hide]

[edit] Definition

A matrix is a rectangular arrangement of numbers.[1] For example,

mathbf{A} = begin{bmatrix}  9 & 13 & 6  1 & 11 & 7  3 & 9 & 2  6 & 0 & 7 end{bmatrix}..

An alternative notation uses large parentheses instead of box brackets:

mathbf{A} = begin{pmatrix}  9 & 13 & 6  1 & 11 & 7  3 & 9 & 2  6 & 0 & 7 end{pmatrix}.

The horizontal and vertical lines in a matrix are called rows and columns, respectively. The numbers in the matrix are called its entries or its elements. To specify a matrix's size, a matrix with m rows and n columns is called an m-by-n matrix or m × n matrix, while m and n are called its dimensions. The above is a 4-by-3 matrix.

A matrix with one row (a 1 × n matrix) is called a row vector, and a matrix with one column (an m × 1 matrix) is called a column vector. Any row or column of a matrix determines a row or column vector, obtained by removing all other rows respectively columns from the matrix. For example, the row vector for the third row of the above matrix A is

begin{bmatrix} 3 & 9 & 2  end{bmatrix}.

When a row or column of a matrix is interpreted as a value, this refers to the corresponding row or column vector. For instance one may say that two different rows of a matrix are equal, meaning they determine the same row vector. In some cases the value of a row or column should be interpreted just as a sequence of values (an element of Rn if entries are real numbers) rather than as a matrix, for instance when saying that the rows of a matrix are equal to the corresponding columns of its transpose matrix.

Most of this article focuses on real and complex matrices, i.e., matrices whose entries are real or complex numbers. More general types of entries are discussed below.

[edit] Notation

The specifics of matrices notation varies widely, with some prevailing trends. Matrices are usually denoted using upper-case letters, while the corresponding lower-case letters, with two subscript indices, represent the entries. In addition to using upper-case letters to symbolize matrices, many authors use a special typographical style, commonly boldface upright (non-italic), to further distinguish matrices from other variables. An alternative notation involves the use of a double-underline with the variable name, with or without boldface style, (e.g., underline{underline{A}}).

The entry that lies in the i-th row and the j-th column of a matrix is typically referred to as the i,j, (i,j), or (i,j)th entry of the matrix. For example, the (2,3) entry of the above matrix A is 7. The (i, j)th entry of a matrix A is most commonly written as ai,j. Alternative notations for that entry are A[i,j] or Ai,j.

Sometimes a matrix is referred to by giving a formula for its (i,j)th entry, often with double parenthesis around the formula for the entry, for example, if the (i,j)th entry of A were given by aij, A would be denoted ((aij)).

An asterisk is commonly used to refer to whole rows or columns in a matrix. For example, ai,∗ refers to the ith row of A, and a∗,j refers to the jth column of A. The set of all m-by-n matrices is denoted mathbb{M}(m, n).

A common shorthand is

A = [ai,j]i=1,...,m; j=1,...,n or more briefly A = [ai,j]m×n

to define an m × n matrix A. Usually the entries ai,j are defined separately for all integers 1 ≤ im and 1 ≤ jn. They can however sometimes be given by one formula; for example the 3-by-4 matrix

mathbf A = begin{bmatrix} 0 & -1 & -2 & -3 1 & 0 & -1 & -2 2 & 1 & 0 & -1 end{bmatrix}

can alternatively be specified by A = [ij]i=1,2,3; j=1,...,4, or simply A = ((i-j)), where the size of the matrix is understood.

Some programming languages start the numbering of rows and columns at zero, in which case the entries of an m-by-n matrix are indexed by 0 ≤ im − 1 and 0 ≤ jn − 1.[2] This article follows the more common convention in mathematical writing where enumeration starts from 1.

[edit] Interpretation as a parallelogram

The vectors represented by a matrix can be thought of as the sides of a unit square transformed into a parallelogram. The area of this parallelogram is the absolute value of the determinant of the matrix.

If A is a 2×2 matrix

 A = begin{bmatrix} a & bc & d end{bmatrix},

then the matrix A can be viewed as the transform of the unit square into a parallelogram with vertices at (0,0), (a,b), (a + c, b + d), and (c,d). The assumption here is that a linear transformation is applied to row vectors as the vector-matrix product xTAT, where x is a column vector. The parallelogram in the figure is obtained by multiplying matrix A (which stores the co-ordinates of our parallelogram) with each of the row vectors  begin{bmatrix} 0 & 0 end{bmatrix}, begin{bmatrix} 1 & 0 end{bmatrix}, begin{bmatrix} 1 & 1 end{bmatrix} and begin{bmatrix}0 & 1end{bmatrix} in turn. These row vectors define the vertices of the unit square. With the more common matrix-vector product Ax, the parallelogram has vertices at begin{bmatrix} 0  0  end{bmatrix}, begin{bmatrix} a  c end{bmatrix}, begin{bmatrix} a+b  c+d end{bmatrix} and  begin{bmatrix} b  d end{bmatrix} (note that Ax = (xTAT)T ).

Further, the area of this parallelogram can be viewed as the absolute value of the determinant of the matrix A. When the determinant is equal to one, then the matrix represents an equi-areal mapping.

[edit] Basic operations

There are a number of operations that can be applied to modify matrices called matrix addition, scalar multiplication and transposition.[3] These form the basic techniques to deal with matrices.

OperationDefinitionExample
AdditionThe sum A+B of two m-by-n matrices A and B is calculated entrywise: (A + B)i,j = Ai,j + Bi,j, where 1 ≤ im and 1 ≤ jn.

  begin{bmatrix} 1 & 3 & 1  1 & 0 & 0 end{bmatrix} + begin{bmatrix} 0 & 0 & 5   7 & 5 & 0 end{bmatrix} = begin{bmatrix} 1+0 & 3+0 & 1+5  1+7 & 0+5 & 0+0 end{bmatrix} = begin{bmatrix} 1 & 3 & 6  8 & 5 & 0 end{bmatrix}

Scalar multiplicationThe scalar multiplication cA of a matrix A and a number c (also called a scalar in the parlance of abstract algebra) is given by multiplying every entry of A by c: (cA)i,j = c · Ai,j.2 cdot  begin{bmatrix} 1 & 8 & -3  4 & -2 & 5 end{bmatrix} = begin{bmatrix} 2 cdot 1 & 2cdot 8 & 2cdot -3  2cdot 4 & 2cdot -2 & 2cdot 5 end{bmatrix} = begin{bmatrix} 2 & 16 & -6  8 & -4 & 10 end{bmatrix}
TransposeThe transpose of an m-by-n matrix A is the n-by-m matrix AT (also denoted Atr or tA) formed by turning rows into columns and vice versa: (AT)i,j = Aj,i.  begin{bmatrix} 1 & 2 & 3  0 & -6 & 7 end{bmatrix}^T =  begin{bmatrix} 1 & 0  2 & -6  3 & 7 end{bmatrix}

Familiar properties of numbers extend to these operations of matrices: for example, addition is commutative, i.e. the matrix sum does not depend on the order of the summands: A + B = B + A.[4] The transpose is compatible with addition and scalar multiplication, as expressed by (cA)T = c(AT) and (A + B)T = AT + BT. Finally, (AT)T = A.

Row operations are ways to change matrices. There are three types of row operations: row switching, that is interchanging two rows of a matrix, row multiplication, multiplying all entries of a row by a non-zero constant and finally row addition which means adding a multiple of a row to another row. These row operations are used in a number of ways including solving linear equations and finding inverses.

[edit] Matrix multiplication, linear equations and linear transformations

Schematic depiction of the matrix product AB of two matrices A and B.

Multiplication of two matrices is defined only if the number of columns of the left matrix is the same as the number of rows of the right matrix. If A is an m-by-n matrix and B is an n-by-p matrix, then their matrix product AB is the m-by-p matrix whose entries are given by dot-product of the corresponding row of A and the corresponding column of B:

 [mathbf{AB}]_{i,j} = A_{i,1}B_{1,j} + A_{i,2}B_{2,j} + cdots + A_{i,n}B_{n,j} = sum_{r=1}^n A_{i,r}B_{r,j},

where 1 ≤ im and 1 ≤ jp.[5] For example (the underlined entry 1 in the product is calculated as the product 1 · 1 + 0 · 1 + 2 · 0 = 1):

 begin{align} begin{bmatrix} underline{1} & underline 0 & underline 2  -1 & 3 & 1  end{bmatrix} times begin{bmatrix} 3 & underline 1  2 & underline 1  1 & underline 0  end{bmatrix} &= begin{bmatrix} 5 & underline 1  4 & 2  end{bmatrix}. end{align}

Matrix multiplication satisfies the rules (AB)C = A(BC) (associativity), and (A+B)C = AC+BC as well as C(A+B) = CA+CB (left and right distributivity), whenever the size of the matrices is such that the various products are defined.[6] The product AB may be defined without BA being defined, namely if A and B are m-by-n and n-by-k matrices, respectively, and mk. Even if both products are defined, they need not be equal, i.e. generally one has

ABBA,

i.e., matrix multiplication is not commutative, in marked contrast to (rational, real, or complex) numbers whose product is independent of the order of the factors. An example of two matrices not commuting with each other is:

begin{bmatrix} 1 & 2 3 & 4 end{bmatrix} times begin{bmatrix} 0 & 1 0 & 0 end{bmatrix}= begin{bmatrix} 0 & 1 0 & 3 end{bmatrix},

whereas

begin{bmatrix} 0 & 1 0 & 0 end{bmatrix} times begin{bmatrix} 1 & 2 3 & 4 end{bmatrix}= begin{bmatrix} 3 & 4 0 & 0 end{bmatrix} .

The identity matrix In of size n is the n-by-n matrix in which all the elements on the main diagonal are equal to 1 and all other elements are equal to 0, e.g.

  mathbf{I}_3 = begin{bmatrix} 1 & 0 & 0  0 & 1 & 0  0 & 0 & 1 end{bmatrix}.

It is called identity matrix because multiplication with it leaves a matrix unchanged: MIn = ImM = M for any m-by-n matrix M.

Besides the ordinary matrix multiplication just described, there exist other less frequently used operations on matrices that can be considered forms of multiplication, such as the Hadamard product and the Kronecker product.[7] They arise in solving matrix equations such as the Sylvester equation.

[edit] Linear equations

A particular case of matrix multiplication is tightly linked to linear equations: if x designates a column vector (i.e. n×1-matrix) of n variables x1, x2, ..., xn, and A is an m-by-n matrix, then the matrix equation

Ax = b,

where b is some m×1-column vector, is equivalent to the system of linear equations

A1,1x1 + A1,2x2 + ... + A1,nxn = b1...Am,1x1 + Am,2x2 + ... + Am,nxn = bm .[8]

This way, matrices can be used to compactly write and deal with multiple linear equations, i.e. systems of linear equations.

[edit] Linear transformations

Matrices and matrix multiplication reveal their essential features when related to linear transformations, also known as linear maps. A real m-by-n matrix A gives rise to a linear transformation RnRm mapping each vector x in Rn to the (matrix) product Ax, which is a vector in Rm. Conversely, each linear transformation f: RnRm arises from a unique m-by-n matrix A: explicitly, the (i, j)-entry of A is the ith coordinate of f(ej), where ej = (0,...,0,1,0,...,0) is the unit vector with 1 in the jth position and 0 elsewhere. The matrix A is said to represent the linear map f, and A is called the transformation matrix of f.

The following table shows a number of 2-by-2 matrices with the associated linear maps of R2. The blue original is mapped to the green grid and shapes, the origin (0,0) is marked with a black point.

Horizontal shear with m=1.25.Horizontal flipSqueeze mapping with r=3/2Scaling by a factor of 3/2Rotation by π/6R = 30°
begin{bmatrix} 1 & 1.25   0 & 1 end{bmatrix}begin{bmatrix} -1 & 0   0 & 1 end{bmatrix}begin{bmatrix} 3/2 & 0   0 & 2/3 end{bmatrix}begin{bmatrix} 3/2 & 0   0 & 3/2 end{bmatrix}begin{bmatrix}cos(pi / 6^{R}) & -sin(pi / 6^{R}) sin(pi / 6^{R}) & cos(pi / 6^{R})end{bmatrix}
VerticalShear m=1.25.svgFlip map.svgSqueeze r=1.5.svgScaling by 1.5.svgRotation by pi over 6.svg

Under the 1-to-1 correspondence between matrices and linear maps, matrix multiplication corresponds to composition of maps:[9] if a k-by-m matrix B represents another linear map g : RmRk, then the composition gf is represented by BA since

(gf)(x) = g(f(x)) = g(Ax) = B(Ax) = (BA)x.

The last equality follows from the above-mentioned associativity of matrix multiplication.

The rank of a matrix A is the maximum number of linearly independent row vectors of the matrix, which is the same as the maximum number of linearly independent column vectors.[10] Equivalently it is the dimension of the image of the linear map represented by A.[11] The rank-nullity theorem states that the dimension of the kernel of a matrix plus the rank equals the number of columns of the matrix.[12]

[edit] Square matrices

A square matrix is a matrix which has the same number of rows and columns. An n-by-n matrix is known as a square matrix of order n. Any two square matrices of the same order can be added and multiplied. A square matrix A is called invertible or non-singular if there exists a matrix B such that

AB = In.[13]

This is equivalent to BA = In.[14] Moreover, if B exists, it is unique and is called the inverse matrix of A, denoted A−1.

The entries Ai,i form the main diagonal of a matrix. The trace, tr(A) of a square matrix A is the sum of its diagonal entries. While, as mentioned above, matrix multiplication is not commutative, the trace of the product of two matrices is independent of the order of the factors: tr(AB) = tr(BA).[15]

Also, the trace of a matrix is equal to that of its transpose, i.e. tr(A) = tr(AT).

If all entries outside the main diagonal are zero, A is called a diagonal matrix. If only all entries above (below) the main diagonal are zero, A is called a lower triangular matrix (upper triangular matrix, respectively). For example, if n = 3, they look like

       begin{bmatrix}            d_{11} & 0 & 0             0 & d_{22} & 0             0 & 0 & d_{33}          end{bmatrix} (diagonal),        begin{bmatrix}            l_{11} & 0 & 0             l_{21} & l_{22} & 0             l_{31} & l_{32} & l_{33}          end{bmatrix} (lower) and          begin{bmatrix}            u_{11} & u_{12} & u_{13}             0 & u_{22} & u_{23}             0 & 0 & u_{33}          end{bmatrix} (upper triangular matrix).

[edit] Determinant

A linear transformation on R2 given by the indicated matrix. The determinant of this matrix is −1, as the area of the green parallelogram at the right is 1, but the map reverses the orientation, since it turns the counterclockwise orientation of the vectors to a clockwise one.

The determinant det(A) or |A| of a square matrix A is a number encoding certain properties of the matrix. A matrix is invertible if and only if its determinant is nonzero. Its absolute value equals the area (in R2) or volume (in R3) of the image of the unit square (or cube), while its sign corresponds to the orientation of the corresponding linear map: the determinant is positive if and only if the orientation is preserved.

The determinant of 2-by-2 matrices is given by

det begin{pmatrix}a&bc&dend{pmatrix} = ad-bc,

the determinant of 3-by-3 matrices involves 6 terms (rule of Sarrus). The more lengthy Leibniz formula generalises these two formulae to all dimensions.[16]

The determinant of a product of square matrices equals the product of their determinants: det(AB) = det(A) · det(B).[17] Adding a multiple of any row to another row, or a multiple of any column to another column, does not change the determinant. Interchanging two rows or two columns affects the determinant by multiplying it by −1.[18] Using these operations, any matrix can be transformed to a lower (or upper) triangular matrix, and for such matrices the determinant equals the product of the entries on the main diagonal; this provides a method to calculate the determinant of any matrix. Finally, the Laplace expansion expresses the determinant in terms of minors, i.e., determinants of smaller matrices.[19] This expansion can be used for a recursive definition of determinants (taking as starting case the determinant of a 1-by-1 matrix, which is its unique entry, or even the determinant of a 0-by-0 matrix, which is 1), that can be seen to be equivalent to the Leibniz formula. Determinants can be used to solve linear systems using Cramer's rule, where the division of the determinants of two related square matrices equates to the value of each of the system's variables.[20]

[edit] Eigenvalues and eigenvectors

A number λ and a non-zero vector v satisfying

Av = λv

are called an eigenvalue and an eigenvector of A, respectively.[nb 1][21] The number λ is an eigenvalue of an n×n-matrix A if and only if A−λIn is not invertible, which is equivalent to

det(mathsf{A}-lambda mathsf{I}) = 0. [22]

The function pA(t) = det(AtI) is called the characteristic polynomial of A, its degree is n. Therefore pA(t) has at most n different roots, i.e., eigenvalues of the matrix.[23] They may be complex even if the entries of A are real. According to the Cayley-Hamilton theorem, pA(A) = 0, that is to say, the characteristic polynomial applied to the matrix itself yields the zero matrix.

[edit] Symmetry

A square matrix A that is equal to its transpose, i.e. A = AT, is a symmetric matrix. If instead, A was equal to the negative of its transpose, i.e. A = −AT, then A is a skew-symmetric matrix. In complex matrices, symmetry is often replaced by the concept of Hermitian matrices, which satisfy A = A, where the star or asterisk denotes the conjugate transpose of the matrix, i.e. the transpose of the complex conjugate of A.

By the spectral theorem, real symmetric matrices and complex Hermitian matrices have an eigenbasis; i.e., every vector is expressible as a linear combination of eigenvectors. In both cases, all eigenvalues are real.[24] This theorem can be generalized to infinite-dimensional situations related to matrices with infinitely many rows and columns, see below.

[edit] Definiteness

Matrix A; definiteness; associated quadratic form QA(x,y);
set of vectors (x,y) such that QA(x,y)=1
begin{bmatrix} 1/4 & 0 0 & 1end{bmatrix}begin{bmatrix} 1/4 & 0 0 & -1/4end{bmatrix}
positive definiteindefinite
1/4 x2 + y21/4 x2 − 1/4 y2
Ellipse in coordinate system with semi-axes labelled.svg
Ellipse
Hyperbola2.png
Hyperbola

A symmetric n×n-matrix is called positive-definite (respectively negative-definite; indefinite), if for all nonzero vectors x ∈ Rn the associated quadratic form given by

Q(x) = xTAx

takes only positive values (respectively only negative values; both some negative and some positive values).[25] If the quadratic form takes only non-negative (respectively only non-positive) values, the symmetric matrix is called positive-semidefinite (respectively negative-semidefinite); hence the matrix is indefinite precisely when it is neither positive-semidefinite nor negative-semidefinite.

A symmetric matrix is positive-definite if and only if all its eigenvalues are positive.[26] The table at the right shows two possibilities for 2-by-2 matrices.

Allowing as input two different vectors instead yields the bilinear form associated to A:

BA (x, y) = xTAy.[27]

[edit] Computational aspects

In addition to theoretical knowledge of properties of matrices and their relation to other fields, it is important for practical purposes to perform matrix calculations effectively and precisely. The domain studying these matters is called numerical linear algebra.[28] As with other numerical situations, two main aspects are the complexity of algorithms and their numerical stability. Many problems can be solved by both direct algorithms or iterative approaches. For example, finding eigenvectors can be done by finding a sequence of vectors xn converging to an eigenvector when n tends to infinity.[29]

Determining the complexity of an algorithm means finding upper bounds or estimates of how many elementary operations such as additions and multiplications of scalars are necessary to perform some algorithm, e.g. multiplication of matrices. For example, calculating the matrix product of two n-by-n matrix using the definition given above needs n3 multiplications, since for any of the n2 entries of the product, n multiplications are necessary. The Strassen algorithm outperforms this "naive" algorithm; it needs only n2.807 multiplications.[30] A refined approach also incorporates specific features of the computing devices.

In many practical situations additional information about the matrices involved is known. An important case are sparse matrices, i.e. matrices most of whose entries are zero. There are specifically adapted algorithms for, say, solving linear systems Ax = b for sparse matrices A, such as the conjugate gradient method.[31]

An algorithm is, roughly speaking, numerically stable, if little deviations (such as rounding errors) do not lead to big deviations in the result. For example, calculating the inverse of a matrix via Laplace's formula (Adj (A) denotes the adjugate matrix of A)

A−1 = Adj(A) / det(A)

may lead to significant rounding errors if the determinant of the matrix is very small. The norm of a matrix can be used to capture the conditioning of linear algebraic problems, such as computing a matrix' inverse.[32]

Although most computer languages are not designed with commands or libraries for matrices, as early as the 1970s, some engineering desktop computers such as the HP 9830 had ROM cartridges to add BASIC commands for matrices. Some computer languages such as APL were designed to manipulate matrices, and various mathematical programs can be used to aid computing with matrices.[33]

[edit] Matrix decomposition methods

There are several methods to render matrices into a more easily accessible form. They are generally referred to as matrix transformation or matrix decomposition techniques. The interest of all these decomposition techniques is that they preserve certain properties of the matrices in question, such as determinant, rank or inverse, so that these quantities can be calculated after applying the transformation, or that certain matrix operations are algorithmically easier to carry out for some types of matrices.

The LU decomposition factors matrices as a product of lower (L) and an upper triangular matrices (U).[34] Once this decomposition is calculated, linear systems can be solved more efficiently, by a simple technique called forward and back substitution. Likewise, inverses of triangular matrices are algorithmically easier to calculate. The Gaussian elimination is a similar algorithm; it transforms any matrix to row echelon form.[35] Both methods proceed by multiplying the matrix by suitable elementary matrices, which correspond to permuting rows or columns and adding multiples of one row to another row. Singular value decomposition expresses any matrix A as a product UDV, where U and V are unitary matrices and D is a diagonal matrix.

A matrix in Jordan normal form. The grey blocks are called Jordan blocks.

The eigendecomposition or diagonalization expresses A as a product VDV−1, where D is a diagonal matrix and V is a suitable invertible matrix.[36] If A can be written in this form, it is called diagonalizable. More generally, and applicable to all matrices, the Jordan decomposition transforms a matrix into Jordan normal form, that is to say matrices whose only nonzero entries are the eigenvalues λ1 to λn of A, placed on the main diagonal and possibly entries equal to one directly above the main diagonal, as shown at the right.[37] Given the eigendecomposition, the nth power of A (i.e. n-fold iterated matrix multiplication) can be calculated via

An = (VDV−1)n = VDV−1VDV−1...VDV−1 = VDnV−1

and the power of a diagonal matrix can be calculated by taking the corresponding powers of the diagonal entries, which is much easier than doing the exponentiation for A instead. This can be used to compute the matrix exponential eA, a need frequently arising in solving linear differential equations, matrix logarithms and square roots of matrices.[38] To avoid numerically ill-conditioned situations, further algorithms such as the Schur decomposition can be employed.[39]

[edit] Abstract algebraic aspects and generalizations

Matrices can be generalized in different ways. Abstract algebra uses matrices with entries in more general fields or even rings, while linear algebra codifies properties of matrices in the notion of linear maps. It is possible to consider matrices with infinitely many columns and rows. Another extension are tensors, which can be seen as higher-dimensional arrays of numbers, as opposed to vectors, which can often be realised as sequences of numbers, while matrices are rectangular or two-dimensional array of numbers.[40] Matrices, subject to certain requirements tend to form groups known as matrix groups.

[edit] Matrices with more general entries

This article focuses on matrices whose entries are real or complex numbers. However, matrices can be considered with much more general types of entries than real or complex numbers. As a first step of generalization, any field, i.e. a set where addition, subtraction, multiplication and division operations are defined and well-behaved, may be used instead of R or C, for example rational numbers or finite fields. For example, coding theory makes use of matrices over finite fields. Wherever eigenvalues are considered, as these are roots of a polynomial they may exist only in a larger field than that of the coefficients of the matrix; for instance they may be complex in case of a matrix with real entries. The possibility to reinterpret the entries of a matrix as elements of a larger field (e.g., to view a real matrix as a complex matrix whose entries happen to be all real) then allows considering each square matrix to possess a full set of eigenvalues. Alternatively one can consider only matrices with entries in an algebraically closed field, such as C, from the outset.

More generally, abstract algebra makes great use of matrices with entries in a ring R.[41] Rings are a more general notion than fields in that no division operation exists. The very same addition and multiplication operations of matrices extend to this setting, too. The set M(n, R) of all square n-by-n matrices over R is a ring called matrix ring, isomorphic to the endomorphism ring of the left R-module Rn.[42] If the ring R is commutative, i.e., its multiplication is commutative, then M(n, R) is a unitary noncommutative (unless n = 1) associative algebra over R. The determinant of square matrices over a commutative ring R can still be defined using the Leibniz formula; such a matrix is invertible if and only if its determinant is invertible in R, generalising the situation over a field F, where every nonzero element is invertible.[43] Matrices over superrings are called supermatrices.[44]

Matrices do not always have all their entries in the same ring - or even in any ring at all. One special but common case is block matrices, which may be considered as matrices whose entries themselves are matrices. The entries need not be quadratic matrices, and thus need not be members of any ordinary ring; but their sizes must fulfil certain compatibility conditions.

[edit] Relationship to linear maps

Linear maps RnRm are equivalent to m-by-n matrices, as described above. More generally, any linear map f: VW between finite-dimensional vector spaces can be described by a matrix A = (aij), after choosing bases v1, ..., vn of V, and w1, ..., wm of W (so n is the dimension of V and m is the dimension of W), which is such that

f(mathbf{v}_j) = sum_{i=1}^m a_{i,j} mathbf{w}_iqquadmbox{for }j=1,ldots,n.

In other words, column j of A expresses the image of vj in terms of the basis vectors wi of W; thus this relation uniquely determines the entries of the matrix A. Note that the matrix depends on the choice of the bases: different choices of bases give rise to different, but equivalent matrices.[45] Many of the above concrete notions can be reinterpreted in this light, for example, the transpose matrix AT describes the transpose of the linear map given by A, with respect to the dual bases.[46]

[edit] Matrix groups

A group is a mathematical structure consisting of a set of objects together with a binary operation, i.e. an operation combining any two objects to a third, subject to certain requirements.[47] A group in which the objects are matrices and the group operation is matrix multiplication is called a matrix group.[nb 2][48] Since in a group every element has to be invertible, the most general matrix groups are the groups of all invertible matrices of a given size, called the general linear groups.

Any property of matrices that is preserved under matrix products and inverses can be used to define further matrix groups. For example, matrices with a given size and with a determinant of 1 form a subgroup of (i.e. a smaller group contained in) their general linear group, called a special linear group.[49] Orthogonal matrices, determined by the condition

MTM = I,

form the orthogonal group.[50] They are called orthogonal since the associated linear transformations of Rn preserve angles in the sense that the scalar product of two vectors is unchanged after applying M to them:

(Mv) · (Mw) = v · w.[51]

Every finite group is isomorphic to a matrix group, as one can see by considering the regular representation of the symmetric group.[52] General groups can be studied using matrix groups, which are comparatively well-understood, by means of representation theory.[53]

[edit] Infinite matrices

It is also possible to consider matrices with infinitely many rows and/or columns[54] even if, being infinite objects, one cannot write down such matrices explicitly. All that matters is that for every element in the set indexing rows, and every element in the set indexing columns, there is a well-defined entry (these index sets need not even be subsets of the natural numbers). The basic operations of addition, subtraction, scalar multiplication and transposition can still be defined without problem; however matrix multiplication may involve infinite summations to define the resulting entries, and these are not defined in general.

If infinite matrices are used to describe linear maps, then only those matrices can be used all of whose columns have but a finite number of nonzero entries, for the following reason. For a matrix A to describe a linear map f: VW, bases for both spaces must have been chosen; recall that by definition this means that every vector in the space can be written uniquely as a (finite) linear combination of basis vectors, so that written as a (column) vector v of coefficients, only finitely many entries vi are nonzero. Now the columns of A describe the images by f of individual basis vectors of V in the basis of W, which is only meaningful if these columns have only finitely many nonzero entries. There is no restriction on the rows of A however: in the product A·v there are only finitely many nonzero coefficients of v involved, so every one of its entries, even if it is given as an infinite sum of products, involves only finitely many nonzero terms and is therefore well defined. Moreover this amounts to forming a linear combination of the columns of A that effectively involves only finitely many of them, whence the result has only finitely many nonzero entries, because each of those columns do. One also sees that products of two matrices of the given type is well defined (provided as usual that the column-index and row-index sets match), is again of the same type, and corresponds to the composition of linear maps.

Infinite matrices can also be used to describe operators on Hilbert spaces, where convergence and continuity questions arise, which again results in certain constraints that have to be imposed. However, the explicit point of view of matrices tends to obfuscate the matter,[nb 3] and the abstract and more powerful tools of functional analysis can be used instead.

[edit] Empty matrices

An empty matrix is a matrix in which the number of rows or columns (or both) is zero.[55][56] An empty matrix has no entries but it still has a well defined number of rows and columns, which are needed for instance in the definition of the matrix product. Thus if A is the 3-by-0 matrix A and B is the 0-by-3 matrix B, then AB is the 3-by-3 zero matrix (corresponding to the null map from a 3-dimensional space V to itself obtained obtained as composition gcirc f of the unique map f from V to a 0-dimensional space Z, followed by the zero map g from Z back to V), while BA is the 0-by-0 matrix (corresponding to the unique map from Z to itself obtained as composition fcirc g). There is no common notation for empty matrices but most computer algebra systems will allow creating them and computing with them. Note that the determinant of the 0-by-0 matrix is 1 (and not 0 as might seem more natural): the Leibniz formula produces this value as a sum over the unique permutation of the empty set, with an empty product as term; also the Laplace expansion for a 1-by-1 matrix makes clear that the value of the 0-by-0 minor should be taken to be 1. This value is also consistent with the fact that the identity map from any finite dimensional space to itself has determinant 1, a fact that is often used as a part of the characterization of determinants.

[edit] Applications

There are numerous applications of matrices, both in mathematics and other sciences. Some of them merely take advantage of the compact representation of a set of numbers in a matrix. For example, in game theory and economics, the payoff matrix encodes the payoff for two players, depending on which out of a given (finite) set of alternatives the players choose.[57] Text mining and automated thesaurus compilation makes use of document-term matrices such as tf-idf in order to keep track of frequencies of certain words in several documents.[58]

Complex numbers can be represented by particular real 2-by-2 matrices via

a + ib leftrightarrow begin{bmatrix} a & -b   b & a end{bmatrix},

under which addition and multiplication of complex numbers and matrices correspond to each other. For example, 2-by-2 rotation matrices represent the multiplication with some complex number of absolute value 1, as above. A similar interpretation is possible for quaternions.[59]

Early encryption techniques such as the Hill cipher also used matrices. However, due to the linear nature of matrices, these codes are comparatively easy to break.[60] Computer graphics uses matrices both to represent objects and to calculate transformations of objects using affine rotation matrices to accomplish tasks such as projecting a three-dimensional object onto a two-dimensional screen, corresponding to a theoretical camera observation.[61] Matrices over a polynomial ring are important in the study of control theory.

Chemistry makes use of matrices in various ways, particularly since the use of quantum theory to discuss molecular bonding and spectroscopy. Examples are the overlap matrix and the Fock matrix using in solving the Roothaan equations to obtain the molecular orbitals of the Hartree–Fock method.

[edit] Graph theory

An undirected graph with adjacency matrix begin{bmatrix} 2 & 1 & 0  1 & 0 & 1  0 & 1 & 0 end{bmatrix}.

The adjacency matrix of a finite graph is a basic notion of graph theory.[62] It saves which vertices of the graph are connected by an edge. Matrices containing just two different values (0 and 1 meaning for example "yes" and "no") are called logical matrices. The distance (or cost) matrix contains information about distances of the edges.[63] These concepts can be applied to websites connected hyperlinks or cities connected by roads etc., in which case (unless the road network is extremely dense) the matrices tend to be sparse, i.e. contain few nonzero entries. Therefore, specifically tailored matrix algorithms can be used in network theory.

[edit] Analysis and geometry

The Hessian matrix of a differentiable function ƒ: RnR consists of the second derivatives of ƒ with respect to the several coordinate directions, i.e.[64]

H(f) = left [frac {partial^2f}{partial x_i , partial x_j} right ].

It encodes information about the local growth behaviour of the function: given a critical point x = (x1, ..., xn), i.e., a point where the first partial derivatives partial f / partial x_i of ƒ vanish, the function has a local minimum if the Hessian matrix is positive definite. Quadratic programming can be used to find global minima or maxima of quadratic functions closely related to the ones attached to matrices (see above).[65]

At the saddle point (x = 0, y = 0) (red) of the function f(x,−y) = x2 − y2, the Hessian matrix begin{bmatrix} 2 & 0  0 & -2 end{bmatrix} is indefinite.

Another matrix frequently used in geometrical situations is the Jacobi matrix of a differentiable map f: RnRm. If f1, ..., fm denote the components of f, then the Jacobi matrix is defined as [66]

J(f) = left [frac {partial f_i}{partial x_j} right ]_{1 leq i leq m, 1 leq j leq n}.

If n > m, and if the rank of the Jacobi matrix attains its maximal value m, f is locally invertible at that point, by the implicit function theorem.[67]

Partial differential equations can be classified by considering the matrix of coefficients of the highest-order differential operators of the equation. For elliptic partial differential equations this matrix is positive definite, which has decisive influence on the set of possible solutions of the equation in question.[68]

The finite element method is an important numerical method to solve partial differential equations, widely applied in simulating complex physical systems. It attempts to approximate the solution to some equation by piecewise linear functions, where the pieces are chosen with respect to a sufficiently fine grid, which in turn can be recast as a matrix equation.[69]

[edit] Probability theory and statistics

Two different Markov chains. The chart depicts the number of particles (of a total of 1000) in state "2". Both limiting values can be determined from the transition matrices, which are given by begin{bmatrix}.7&0.3&1end{bmatrix} (red) and begin{bmatrix}.7&.2.3&.8end{bmatrix} (black).

Stochastic matrices are square matrices whose rows are probability vectors, i.e., whose entries sum up to one. Stochastic matrices are used to define Markov chains with finitely many states.[70] A row of the stochastic matrix gives the probability distribution for the next position of some particle which is currently in the state corresponding to the row. Properties of the Markov chain like absorbing states, i.e. states that any particle attains eventually, can be read off the eigenvectors of the transition matrices.[71]

Statistics also makes use of matrices in many different forms.[72] Descriptive statistics is concerned with describing data sets, which can often be represented in matrix form, by reducing the amount of data. The covariance matrix encodes the mutual variance of several random variables.[73] Another technique using matrices are linear least squares, a method that approximates a finite set of pairs (x1, y1), (x2, y2), ..., (xN, yN), by a linear function

yiaxi + b, i = 1, ..., N

which can be formulated in terms of matrices, related to the singular value decomposition of matrices.[74]

Random matrices are matrices whose entries are random numbers, subject to suitable probability distributions, such as matrix normal distribution. Beyond probability theory, they are applied in domains ranging from number theory to physics.[75][76]

[edit] Symmetries and transformations in physics

Linear transformations and the associated symmetries play a key role in modern physics. For example, elementary particles in quantum field theory are classified as representations of the Lorentz group of special relativity and, more specifically, by their behavior under the spin group. Concrete representations involving the Pauli matrices and more general gamma matrices are an integral part of the physical description of fermions, which behave as spinors.[77] For the three lightest quarks, there is a group-theoretical representation involving the special unitary group SU(3); for their calculations, physicists use a convenient matrix representation known as the Gell-Mann matrices, which are also used for the SU(3) gauge group that forms the basis of the modern description of strong nuclear interactions, quantum chromodynamics. The Cabibbo–Kobayashi–Maskawa matrix, in turn, expresses the fact that the basic quark states that are important for weak interactions are not the same as, but linearly related to the basic quark states that define particles with specific and distinct masses.[78]

[edit] Linear combinations of quantum states

The first model of quantum mechanics (Heisenberg, 1925) represented the theory's operators by infinite-dimensional matrices acting on quantum states.[79] This is also referred to as matrix mechanics. One particular example is the density matrix that characterizes the "mixed" state of a quantum system as a linear combination of elementary, "pure" eigenstates.[80]

Another matrix serves as a key tool for describing the scattering experiments which form the cornerstone of experimental particle physics: Collision reactions such as occur in particle accelerators, where non-interacting particles head towards each other and collide in a small interaction zone, with a new set of non-interacting particles as the result, can be described as the scalar product of outgoing particle states and a linear combination of ingoing particle states. The linear combination is given by a matrix known as the S-matrix, which encodes all information about the possible interactions between particles.[81]

[edit] Normal modes

A general application of matrices in physics is to the description of linearly coupled harmonic systems. The equations of motion of such systems can be described in matrix form, with a mass matrix multiplying a generalized velocity to give the kinetic term, and a force matrix multiplying a displacement vector to characterize the interactions. The best way to obtain solutions is to determine the system's eigenvectors, its normal modes, by diagonalizing the matrix equation. Techniques like this are crucial when it comes to the internal dynamics of molecules: the internal vibrations of systems consisting of mutually bound component atoms.[82] They are also needed for describing mechanical vibrations, and oscillations in electrical circuits.[83]

[edit] Geometrical optics

Geometrical optics provides further matrix applications. In this approximative theory, the wave nature of light is neglected. The result is a model in which light rays are indeed geometrical rays. If the deflection of light rays by optical elements is small, the action of a lens or reflective element on a given light ray can be expressed as multiplication of a two-component vector with a two-by-two matrix called ray transfer matrix: the vector's components are the light ray's slope and its distance from the optical axis, while the matrix encodes the properties of the optical element. Actually, there will be two different kinds of matrices, viz. a refraction matrix describing de madharchod refraction at a lens surface, and a translation matrix, describing the translation of the plane of reference to the next refracting surface, where another refraction matrix will apply. The optical system consisting of a combination of lenses and/or reflective elements is simply described by the matrix resulting from the product of the components' matrices.[84]

[edit] Electronics

Traditional mesh analysis in electronics leads to a system of linear equations which can be described with a matrix.

The behaviour of many electronic components can be described using matrices. Let A be a 2-dimensional vector with the component's input voltage v1 and input current i1 as its elements, and let B be a 2-dimensional vector with the component's output voltage v2 and output current i2 as its elements. Then the behaviour of the electronic component can be described by B = H · A, where H is a 2 x 2 matrix containing one impedance element (h12), one admittance element (h21) and two dimensionless elements (h11 and h22). Calculating a circuit now reduces to multiplying matrices.

[edit] History

Matrices have a long history of application in solving linear equations. The Chinese text The Nine Chapters on the Mathematical Art (Jiu Zhang Suan Shu), from between 300 BC and AD 200, is the first example of the use of matrix methods to solve simultaneous equations,[85] including the concept of determinants, over 1000 years before its publication by the Japanese mathematician Seki in 1683[citation needed] and the German mathematician Leibniz in 1693. Cramer presented his rule in 1750.

Early matrix theory emphasized determinants more strongly than matrices and an independent matrix concept akin to the modern notion emerged only in 1858, with Cayley's Memoir on the theory of matrices.[86][87] The term "matrix" was coined by Sylvester, who understood a matrix as an object giving rise to a number of determinants today called minors, that is to say, determinants of smaller matrices which derive from the original one by removing columns and rows. Etymologically, matrix derives from Latin mater (mother).[88]

The study of determinants sprang from several sources.[89] Number-theoretical problems led Gauss to relate coefficients of quadratic forms, i.e., expressions such as x2 + xy − 2y2, and linear maps in three dimensions to matrices. Eisenstein further developed these notions, including the remark that, in modern parlance, matrix products are non-commutative. Cauchy was the first to prove general statements about determinants, using as definition of the determinant of a matrix A = [ai,j] the following: replace the powers ajk by ajk in the polynomial

a_1 a_2 cdots a_n prod_{i < j} (a_j - a_i);,

where Π denotes the product of the indicated terms. He also showed, in 1829, that the eigenvalues of symmetric matrices are real.[90] Jacobi studied "functional determinants"—later called Jacobi determinants by Sylvester—which can be used to describe geometric transformations at a local (or infinitesimal) level, see above; Kronecker's Vorlesungen über die Theorie der Determinanten[91] and Weierstrass' Zur Determinantentheorie,[92] both published in 1903, first treated determinants axiomatically, as opposed to previous more concrete approaches such as the mentioned formula of Cauchy. At that point, determinants were firmly established.

Many theorems were first established for small matrices only, for example the Cayley-Hamilton theorem was proved for 2×2 matrices by Cayley in the aforementioned memoir, and by Hamilton for 4×4 matrices. Frobenius, working on bilinear forms, generalized the theorem to all dimensions (1898). Also at the end of the 19th century the Gauss-Jordan elimination (generalizing a special case now known as Gauss elimination) was established by Jordan. In the early 20th century, matrices attained a central role in linear algebra.[93] partially due to their use in classification of the hypercomplex number systems of the previous century.

The inception of matrix mechanics by Heisenberg, Born and Jordan led to studying matrices with infinitely many rows and columns.[94] Later, von Neumann carried out the mathematical formulation of quantum mechanics, by further developing functional analytic notions such as linear operators on Hilbert spaces, which, very roughly speaking, correspond to Euclidean space, but with an infinity of independent directions.

[edit] Other historical usages of the word "matrix" in mathematics

The word has been used in unusual ways by at least two authors of historical importance.

Bertrand Russell and Alfred North Whitehead in their Principia Mathematica (1910–1913) use the word matrix in the context of their Axiom of reducibility. They proposed this axiom as a means to reduce any function to one of lower type, successively, so that at the "bottom" (0 order) the function will be identical to its extension[disambiguation needed]:

"Let us give the name of matrix to any function, of however many variables, which does not involve any apparent variables. Then any possible function other than a matrix is derived from a matrix by means of generalization, i.e. by considering the proposition which asserts that the function in question is true with all possible values or with some value of one of the arguments, the other argument or arguments remaining undetermined".[95]

For example a function Φ(x, y) of two variables x and y can be reduced to a collection of functions of a single variable, e.g. y, by "considering" the function for all possible values of "individuals" ai substituted in place of variable x. And then the resulting collection of functions of the single variable y, i.e. ∀ai: Φ(ai, y), can be reduced to a "matrix" of values by "considering" the function for all possible values of "individuals" bi substituted in place of variable y:

∀bj∀ai: Φ(ai, bj).

Alfred Tarski in his 1946 Introduction to Logic used the word "matrix" synonymously with the notion of truth table as used in mathematical logic.[96]

[edit] See also

[edit] Notes

  1. ^ Brown 1991, Chapter I.1. Alternative references for this book include Lang 1987b and Greub 1975
  2. ^ Oualline 2003, Ch. 5
  3. ^ Brown 1991, Definition I.2.1 (addition), Definition I.2.4 (scalar multiplication), and Definition I.2.33 (transpose)
  4. ^ Brown 1991, Theorem I.2.6
  5. ^ Brown 1991, Definition I.2.20
  6. ^ Brown 1991, Theorem I.2.24
  7. ^ Horn & Johnson 1985, Ch. 4 and 5
  8. ^ Brown 1991, I.2.21 and 22
  9. ^ Greub 1975, Section III.2
  10. ^ Brown 1991, Definition II.3.3
  11. ^ Greub 1975, Section III.1
  12. ^ Brown 1991, Theorem II.3.22
  13. ^ Brown 1991, Definition I.2.28
  14. ^ Brown 1991, Definition I.5.13
  15. ^ This is immediate from the definition of matrix multiplication. scriptstyleoperatorname{tr}(mathsf{AB}) = sum_{i=1}^m sum_{j=1}^n A_{ij} B_{ji} = operatorname{tr}(mathsf{BA}).
  16. ^ Brown 1991, Definition III.2.1
  17. ^ Brown 1991, Theorem III.2.12
  18. ^ Brown 1991, Corollary III.2.16
  19. ^ Mirsky 1990, Theorem 1.4.1
  20. ^ Brown 1991, Theorem III.3.18
  21. ^ Brown 1991, Definition III.4.1
  22. ^ Brown 1991, Definition III.4.9
  23. ^ Brown 1991, Corollary III.4.10
  24. ^ Horn & Johnson 1985, Theorem 2.5.6
  25. ^ Horn & Johnson 1985, Chapter 7
  26. ^ Horn & Johnson 1985, Theorem 7.2.1
  27. ^ Horn & Johnson 1985, Example 4.0.6, p. 169
  28. ^ Bau III & Trefethen 1997
  29. ^ Householder 1975, Ch. 7
  30. ^ Golub & Van Loan 1996, Algorithm 1.3.1
  31. ^ Golub & Van Loan 1996, Chapters 9 and 10, esp. section 10.2
  32. ^ Golub & Van Loan 1996, Chapter 2.3
  33. ^ For example, Mathematica, see Wolfram 2003, Ch. 3.7
  34. ^ Press, Flannery & Teukolsky 1992
  35. ^ Stoer & Bulirsch 2002, Section 4.1
  36. ^ Horn & Johnson 1985, Theorem 2.5.4
  37. ^ Horn & Johnson 1985, Ch. 3.1, 3.2
  38. ^ Arnold & Cooke 1992, Sections 14.5, 7, 8
  39. ^ Bronson 1989, Ch. 15
  40. ^ Coburn 1955, Ch. V
  41. ^ Lang 2002, Chapter XIII
  42. ^ Lang 2002, XVII.1, p. 643
  43. ^ Lang 2002, Proposition XIII.4.16
  44. ^ Reichl 2004, Section L.2
  45. ^ Greub 1975, Section III.3
  46. ^ Greub 1975, Section III.3.13
  47. ^ See any standard reference in group.
  48. ^ Baker 2003, Def. 1.30
  49. ^ Baker 2003, Theorem 1.2
  50. ^ Artin 1991, Chapter 4.5
  51. ^ Artin 1991, Theorem 4.5.13
  52. ^ Rowen 2008, Example 19.2, p. 198
  53. ^ See any reference in representation theory or group representation.
  54. ^ See the item "Matrix" in Itõ, ed. 1987
  55. ^ "Empty Matrix: A matrix is empty if either its row or column dimension is zero", Glossary, O-Matrix v6 User Guide
  56. ^ "A matrix having at least one dimension equal to zero is called an empty matrix", MATLAB Data Structures
  57. ^ Fudenberg & Tirole 1983, Section 1.1.1
  58. ^ Manning 1999, Section 15.3.4
  59. ^ Ward 1997, Ch. 2.8
  60. ^ Stinson 2005, Ch. 1.1.5 and 1.2.4
  61. ^ Association for Computing Machinery 1979, Ch. 7
  62. ^ Godsil & Royle 2004, Ch. 8.1
  63. ^ Punnen 2002
  64. ^ Lang 1987a, Ch. XVI.6
  65. ^ Nocedal 2006, Ch. 16
  66. ^ Lang 1987a, Ch. XVI.1
  67. ^ Lang 1987a, Ch. XVI.5. For a more advanced, and more general statement see Lang 1969, Ch. VI.2
  68. ^ Gilbarg & Trudinger 2001
  69. ^ Šolin 2005, Ch. 2.5. See also stiffness method.
  70. ^ Latouche & Ramaswami 1999
  71. ^ Mehata & Srinivasan 1978, Ch. 2.8
  72. ^ Healy, Michael (1986), Matrices for Statistics, Oxford University Press, ISBN 9780198507024 
  73. ^ Krzanowski 1988, Ch. 2.2., p. 60
  74. ^ Krzanowski 1988, Ch. 4.1
  75. ^ Conrey 2007
  76. ^ Zabrodin, Brezin & Kazakov et al. 2006
  77. ^ Itzykson & Zuber 1980, Ch. 2
  78. ^ see Burgess & Moore 2007, section 1.6.3. (SU(3)), section 2.4.3.2. (Kobayashi–Maskawa matrix)
  79. ^ Schiff 1968, Ch. 6
  80. ^ Bohm 2001, sections II.4 and II.8
  81. ^ Weinberg 1995, Ch. 3
  82. ^ Wherrett 1987, part II
  83. ^ Riley, Hobson & Bence 1997, 7.17
  84. ^ Guenther 1990, Ch. 5
  85. ^ Shen, Crossley & Lun 1999 cited by Bretscher 2005, p. 1
  86. ^ Cayley 1889, vol. II, p. 475–496
  87. ^ Dieudonné, ed. 1978, Vol. 1, Ch. III, p. 96
  88. ^ Merriam-Webster dictionary, Merriam-Webster, http://www.merriam-webster.com/dictionary/matrix, retrieved April, 20th 2009 
  89. ^ Knobloch 1994
  90. ^ Hawkins 1975
  91. ^ Kronecker 1897
  92. ^ Weierstrass 1915, pp. 271–286
  93. ^ Bôcher 2004
  94. ^ Mehra & Rechenberg 1987
  95. ^ Alfred North Whitehead and Bertrand Russell (1913) Principia Mathematica to *56, Cambridge at the University Press, Cambridge UK (republished 1962) cf page 162ff.
  96. ^ Tarski, Alfred 1946 Introduction to Logic and the Methodology of Deductive Sciences, Dover Publications, Inc, New York NY, ISBN 0-486-28462-X.
  1. ^ Eigen means "own" in German and in Dutch.
  2. ^ Additionally, the group is required to be closed in the general linear group.
  3. ^ "Not much of matrix theory carries over to infinite-dimensional spaces, and what does is not so useful, but it sometimes helps." Halmos 1982, p. 23, Chapter 5

[edit] References

[edit] Physics references

  • Bohm, Arno (2001), Quantum Mechanics: Foundations and Applications, Springer, ISBN 0-387-95330-2 
  • Burgess, Cliff; Moore, Guy (2007), The Standard Model. A Primer, Cambridge University Press, ISBN 0-521-86036-9 
  • Guenther, Robert D. (1990), Modern Optics, John Wiley, ISBN 0-471-60538-7 
  • Itzykson, Claude; Zuber, Jean-Bernard (1980), Quantum Field Theory, McGraw-Hill, ISBN 0-07-032071-3 
  • Riley, K. F.; Hobson, M. P.; Bence, S. J. (1997), Mathematical methods for physics and engineering, Cambridge University Press, ISBN 0-521-55506-X 
  • Schiff, Leonard I. (1968), Quantum Mechanics (3rd ed.), McGraw-Hill 
  • Weinberg, Steven (1995), The Quantum Theory of Fields. Volume I: Foundations, Cambridge University Press, ISBN 0-521-55001-7 
  • Wherrett, Brian S. (1987), Group Theory for Atoms, Molecules and Solids, Prentice-Hall International, ISBN 0-13-365461-3 
  • Zabrodin, Anton; Brezin, Édouard; Kazakov, Vladimir; Serban, Didina; Wiegmann, Paul (2006), Applications of Random Matrices in Physics (NATO Science Series II: Mathematics, Physics and Chemistry), Berlin, New York: Springer-Verlag, ISBN 978-1-4020-4530-1 

[edit] Historical references

[edit] External links

HistoryOnline booksOnline matrix calculators

  

20/10/2010 20:32 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: POTENCIACIÓN O POTENCIALIDAD. La potenciación es una expresión matemática que incluye dos términos denominados: base a y exponente n.

Potenciación

De Wikipedia, la enciclopedia libre

La potenciación es una expresión matemática que incluye dos términos denominados: base a y exponente n.

Se escribe an, y se lee: «a elevado a n». Su definición varía según el conjunto numérico al que pertenezca el exponente:

  • Cuando el exponente es un número natural, equivale a multiplicar un número por sí mismo varias veces: el exponente determina la cantidad de veces.
a^n = underbrace{a times cdots times a}_n,

Por ejemplo:  2^4 = 2 cdot 2 cdot 2 cdot 2 = 16 .

  • cuando el exponente es un número entero negativo, equivale a la fracción inversa de la base pero con exponente positivo.
a^{-p}= frac{1}{a^p}
  • cuando el exponente es una fracción irreducible n/m, equivale a una raíz:
 a^{frac{n}{m}} = sqrt[m]{a^n}

Cualquier número elevado a 0 equivale a 1, excepto el caso particular de 00 que, en principio, es una indefinición (ver cero).

La definición de potenciación puede extenderse a exponentes reales, complejos o incluso matriciales.

Contenido

[ocultar]

[editar] Propiedades de la potenciación

[editar] Potencia de exponente 0

Un número (distinto de 0) elevado al exponente 0 da como resultado la unidad (1), puesto que:

1 = frac {a^1} {a^1} = a^{1-1} = a^0,

[editar] Potencia de exponente 1

Toda potencia de exponente 1 es igual a la base:

a^1 = a ,

Ejemplo:

54^1=54 ,

[editar] Potencia de exponente negativo

Un número elevado a un exponente negativo, es igual al inverso de la misma expresión pero con exponente positivo:

a^{-n} = a^{0-n} = frac {a^0}{a^n} = frac {1}{a^n},

[editar] Multiplicación de potencias de igual base

El producto de dos o más potencias de igual base es igual a la base elevada a la suma de los correspondientes exponentes (la misma base y se suman los exponentes):

 a^m cdot a^n = a^{m + n}

Ejemplos:

 9^3 cdot 9^2 = 9^{3+2}= 9^5

[editar] División de potencias de igual base

La división de dos potencias de igual base es igual a la base elevada a la resta de los exponentes respectivos:

 frac{a^m}{a^n} = a^{m - n}

Ejemplo:

 frac{9^5}{9^3} = 9^{5-3}= 9^2

[editar] Potencia de un producto

La potencia de un producto es igual al producto de los factores elevados cada uno al exponente de dicha potencia. Es decir, una potencia de base a.b y de exponente n, es igual al factor a elevado a n, multiplicado por el factor b también elevado a n:

(a cdot b)^n=a^n cdot b^n

[editar] Potencia de una potencia

La potencia de una potencia de base a es igual a la potencia de base a y cuyo exponente es el producto de ambos exponentes (la misma base y se multiplican los exponentes):

 {(a^m)}^n = a^{m cdot n}

Debido a esto, la notación a^{b^c} se reserva para significar a^{(b^c)} ya que {(a^b)}^c se puede escribir sencillamente como abc.

[editar] Propiedad distributiva

La potenciación es distributiva con respecto a la multiplicación y a la división:

 (a cdot b)^n = a^n cdot b^n  Big(frac{a}{b}Big)^n = frac{a^n}{b^n}

[editar] Propiedades que no cumple la potenciación

No es distributiva con respecto a la adición y sustracción:

(a + b)^m  neq  a^m + b^m (a - b)^m  neq  a^m - b^m

No cumple la propiedad conmutativa, exceptuando aquellos casos en que base y exponente tienen el mismo valor o son equivalentes. En general:

a^b  neq  b^a

Tampoco cumple la propiedad asociativa:

a^{b^c}=a^{(b^c)}ne (a^b)^c=a^{(bcdot c)}=a^{b c}

[editar] Potencia de base 10

En las potencias con base 10, el resultado será la unidad desplazada tantas posiciones como indique el valor absoluto del exponente: hacia la izquierda si el exponente es positivo, o hacia la derecha si el exponente es negativo.

Ejemplos:

 10^{-5}=0,00001 , 10^{-4}=0,0001 , 10^{-3}=0,001 , 10^{-2}=0,01 , 10^{-1}=0,1 , 10^0=1 , 10^1=10 , 10^2=100 , 10^3=1.000 , 10^4=10.000 , 10^5=100.000 , 10^6=1.000.000 ,

[editar] Potencia de números complejos

Artículo principal: Fórmula de De Moivre

Para cualquiera de los números reales a,b,c,d , se tiene la identidad:

left(a,e^{i,b}right)^{left(c,e^{i,d}right)}=a^{c,cos d},e^{i,left( c,log a,sin d+b,c,cos dright)-b,c,sin d}

[editar] Representación gráfica

gráfico de y = x^2 ,
gráfico de y = x^3 ,

La representación gráfica de una potencia par tiene la forma de una parábola. Su vértice se sitúa en el punto (0, 0), es decreciente en el segundo cuadrante y creciente en el primero.

La representación gráfica de una potencia impar son dos ramas de parábola. Tiene un punto de inflexión en el vértice (0, 0), es siempre creciente, y ocupa el tercer y primer cuadrante.

Dichas curvas son continuas y derivables para todos los reales.

[editar] Límites

[editar] 00

El caso especial 00 se considera indefinido y dependiendo del contexto pueden ser asignados distintos valores dependiendo de las propiedades específicas que se quieran mantener.

Por ejemplo, puede argumentarse que 00 es el igual al valor del límite

lim_{xto 0^+} x^0

y como x0 = 1 para x ne 0, dicho valor podría ser igual a 1. Sin embargo también puede considerarse dicha expresión como el valor del límite

lim_{xto 0^+} 0^x

y como 0x = 0 para x ne 0, dicho valor podría ser igual a 0. Esto ilustra que la forma 00 puede corresponde a diferentes valores y por ello se considera indefinida.

El debate sobre el valor de la forma 00 tiene casi 2 siglos de antigüedad. Durante los primeros días del análisis matemático en que el fundamento formal del cálculo no se había establecido, era común aceptar que 00=1. Sin embargo, en 1821 cuando Cauchy publica el Cours d'Analyse de l'École Royale Polytechnique estableciendo el primer tratamiento riguroso del análisis, lista dicha forma en una tabla de formas indefinidas junto a otras como 0/0. En los 1830s, Libri[1] [2] publicó un argumento para asignar 1 como valor de 00 y August Möbius[3] lo apoyó afirmando erróneamente que

lim_{t to 0^+} f(t)^{g(t)} = 1, siempre que lim_{t to 0^+} f(t) = lim_{t to 0^+} g(t) = 0.

Sin embargo un comentarista que firmó simplemente como «S» proporcionó un contraejemplo

{(e^{-1/t})}^t

cuyo límite cuando tto0^+ es 1 / e, lo cual calmó el debate con la aparente conclusión del incidente que 00 debería permanecer indefinida. Se pueden encontrar más detalles en Knuth (1992).[4]

En la actualidad, suele considerarse la forma 00 como indefinida y no se le asigna valor si no se tiene un contexto en el cual el valor asignado tenga sentido. [5] [6] [7]


Para calcular límites cuyo valor aparente es 00 suele usarse la Regla de l'Hôpital.

[editar] Véase también

[editar] Referencias

  1. Guillaume Libri, Note sur les valeurs de la fonction 00x, Journal für die reine und angewandte Mathematik 6 (1830), 67–72.
  2. Guillaume Libri, Mémoire sur les fonctions discontinues, Journal für die reine und angewandte Mathematik 10 (1833), 303–316.
  3. A. F. Möbius, Beweis der Gleichung 00 = 1, nach J. F. Pfaff, Journal für die reine und angewandte Mathematik 12 (1834), 134–136.
  4. Donald E. Knuth, Two notes on notation, Amer. Math. Monthly 99 no. 5 (May 1992), 403–422.
  5. Peter Alfeld. «Understanding Mathematics» (en inglés). Universidad de Utah. Consultado el 25 de diciembre de 2009. «The problem is similar to that with division by zero. No value can be assigned to 0 to the power 0 without running into contradictions. Thus 0 to the power 0 is undefined!».
  6. Ask Dr. Math. (18 de marzo de 1997). «Why are Operations of Zero so Strange?» (en inglés). The Math forum. Consultado el 25 de diciembre de 2009. «Other indeterminate forms are 0^0, 1^infinity.».
  7. Gentile, Enzo R. (1976) (en español). Notas de Álgebra I (2a edición). Editorial Universitaria de Buenos Aires. pp. 56. «Es útil también definir en el caso x≠0, x0=1. (00 queda indefinido).» 

[editar] Enlaces externos

12/10/2010 16:40 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: TEORÍA DE LA PROBABILIDAD. La teoría de la probabilidad es la teoría matemática que modela los fenómenos aleatorios. Estos deben contraponerse a los fenómenos determinísticos, los cuales son resultados únicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 grados Celsius a nivel del mar se obtendrá vapor. Los fenómenos aleatorios, por el contrario, son aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de un dardo.

Teoría de la probabilidad

De Wikipedia, la enciclopedia libre

La teoría de la probabilidad es la teoría matemática que modela los fenómenos aleatorios. Estos deben contraponerse a los fenómenos determinísticos, los cuales son resultados únicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 grados Celsius a nivel del mar se obtendrá vapor. Los fenómenos aleatorios, por el contrario, son aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de un dardo.

Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos de aleación en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino sólo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí.

En 1933, el matemático soviético Andrés Colmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.

Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Brownia), o las finanzas (donde destaca el modelo de Blacko y Schol para la valuación de acciones).

Contenido

[ocultar]

[editar] Definición clásica de probabilidad

La probabilidad es la característica de un evento, que existen razones para creer que éste se realizará.

La probabilidad p de que suceda un evento S de un total de n casos posibles igualmente probables es igual a la razón entre el número de ocurrencias h de dicho evento (casos favorables) y el número total de casos posibles n.

p=P{S}=frac {h}{n}

La probabilidad es un número (valor) que varia entre 0 y 1. Cuando el evento es imposible se dice que su probabilidad es 0, si el evento es cierto y siempre tiene que ocurrir su probabilidad es 1.

La probabilidad de no ocurrencia de un evento está dada por q, donde:

q=P{no  S}=1-frac {h}{n}

Sabemos que p es la probabilidad de que ocurra un evento y q es la probabilidad de que no ocurra, entonces p + q = 1

Simbólicamente el espacio de resultados, que normalmente se denota por Ω, es el espacio que consiste en todos los resultados que son posibles. Los resultados, que se denota por ω12, etcétera, son elementos del espacio Ω.

[editar] Definición según la frecuencia relativa y definición axiomática

La definición axiomática de la probabilidad se define con base a sí misma (igualmente factible es sinónimo de igualmente probable) se define la probabilidad estimada o empírica basada en la frecuencia relativa de aparición de un suceso S cuando Ω es muy grande. La probabilidad de un suceso es una medida que se escribe como

mathbb{P}{S} ,,

y mide con qué frecuencia ocurre algún suceso si se hace algún experimento indefinidamente.

La definición anterior es complicada de representar matemáticamente ya que Ω debiera ser infinito. Otra manera de definir la probabilidad es de forma axiomática esto estableciendo las relaciones o propiedades que existen entre los conceptos y operaciones que la componen.

Véase también: Axiomas de probabilidad

[editar] Probabilidad discreta

Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes que son el resultado de la cuenta de alguna característica de interés.

[editar] Probabilidad continua

Una variable aleatoria es una función medible

X:Omegatomathbb{R} ,

que da un valor numérico a cada suceso en Ω.

[editar] Función de densidad

Artículo principal: Función de densidad

La función de densidad, o densidad de probabilidad de una variable aleatoria, es una función a partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el caso de variables aleatorias continuas es la distribución de probabilidad. En el caso de variables aleatorias discretas la distribución de probabilidad se obtiene a través del sumatorio de la función de densidad.

[editar] Véase también

[editar] Bibliografía

08/10/2010 09:33 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: CAUSALIDAD (ESTADÍSTICA). En estadística, la causalidad se refiere a una relación de necesidad de coocurrencia de dos variables estadísticas correlacionadas, probar causalidad entre dos variables implica además de que guarden una correlación positiva, estudiar en casos donde una pueda aparecer sin la otra, etc.

Causalidad (estadística)

De Wikipedia, la enciclopedia libre

En estadística, la causalidad se refiere a una relación de necesidad de coocurrencia de dos variables estadísticas correlacionadas, probar causalidad entre dos variables implica además de que guarden una correlación positiva, estudiar en casos donde una pueda aparecer sin la otra, etc.

Contenido

[ocultar]

[editar] Introducción

En epidemiología, el hecho de que dos fenómenos estén estadísticamente relacionados no implica necesariamente que uno sea causa del otro. Para poder afirmar esto último es necesario disponer de dos grupos comparables (constituidos por individuos elegidos al azar), y someter a la exposición al factor estudiado a uno de ellos, estudiando las diferentes tasas de aparición del efecto.

Esto, en la mayoría de los casos es imposible por razones éticas y prácticas, por lo que se recurre a estudios analíticos retrospectivos: Se toman dos grupos, uno con el efecto (por ejemplo, enfermedad) y otro sin él ("sanos"), y se estudia, de manera retrospectiva, cuál fue el grado de exposición a la hipotética causa (factor de riesgo) en cada caso.

No obstante ello los estudios analíticos prospectivos suelen ser los que garantizan - dentro de los límites de confianza estadística fijados - las asociaciones causales más fuertes.

A falta, entonces, de una prueba experimental idónea se han postulado una serie de criterios cuyo cumplimiento garantiza que la asociación no sea "casual", sino "causal". Los más conocidos son los formulados por Sir Austin Bradford Hill:

  • Fuerza de la asociación, estimable mediante las medidas estadísticas correspondientes.
  • Gradiente o efecto dosis-respuesta (a mayor dosis de la causa, mayor cantidad del efecto).
  • Secuencia temporal.
  • Consistencia, o repetición del mismo resultado en otros estudios.
  • Coherencia con otros hallazgos.
  • Analogía con otros fenómenos.
  • Plausibilidad biológica, es decir, existencia de un mecanismo biológico plausible que explique la relación causa-efecto.
  • Especificidad.
  • Evidencia experimental, demostración mediante estudios experimentales.

[editar] Factor condicionante

Un factor condicionante es una variable que parece influir causalmente en otra variable, llamada efecto; aun cuando el factor condicionante no sea la única causa eficiente para el efecto. Formalmente A es un factor condicionante de B si se cumple la siguiente relación entre las probabilidades condicionadas:

(1) P(B|A) > P(B|bar{A}), qquad mbox{con} P(A) ne 0

Es decir, la probabilidad de que se dé B dado que sabemos que está ocurriendo A, es mayor que la probabilidad de que se dé B dado que sabemos que no ocurre A. Esto generaliza la idea de causa, ya que si "A es causa de B" la relación (1) se cumple trivialmente ya que se tiene:

P(B|A) =1, P(B|bar{A}) =0

La idea del factor condicionante, tiene la ventaja de que en ocasiones es difícil demostrar estadísticamente que "A es causa de B", aunque es relativamente fácil de argumentar la validez estadística de que "A es un factor condicionante de B".

[editar] Formas alternativas

Si además sucede que 1 > P(A) > 0, la relación (1) también puede escribirse como:

(1b) P(B) > P(B|bar{A}),qquad mbox{o} qquad P(B|A) > P(B)

Por ejemplo para demostrar la primera relación, basta considerar las siguientes identidades:

begin{matrix} P(B) = P(B|A)P(A) + P(B|bar{A})P(bar{A}) = P(B|A)P(A) + P(B|bar{A})(1-P(A))  Rightarrow P(B) = P(B|bar{A}) + P(A)[P(B|A) - P(B|bar{A})] ge P(B|bar{A}) +varepsilon end{matrix}

Siendo:

delta:=P(B|A) - P(B|bar{A})> 0varepsilon = P(A)delta > 0

Similarmente, se puede demostrar la otra identidad:

begin{matrix} P(B) = P(B|A)P(A) + P(B|bar{A})P(bar{A}) = P(B|A)(1-P(bar{A})) + P(B|bar{A})P(bar{A})  Rightarrow P(B) = P(B|A) + P(bar{A})[P(B|bar{A}) - P(B|A)] le P(B|A) - bar{varepsilon} end{matrix}

Donde:

bar{varepsilon} = P(bar{A})delta > 0

[editar] Véase también

[editar] Enlaces externos

07/10/2010 21:06 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: MODELO MATEMÁTICO. En ciencias aplicadas, un Modelo matemático es uno de los tipos de modelos científicos, que emplea algún tipo de formulismo matemático para expresar relaciones, proposiciones sustantivas de hechos, variables, parámetros, entidades y relaciones entre variables y/o entidades u operaciones, para estudiar comportamientos de sistemas complejos ante situaciones difíciles de observar en la realidad. El término modelización matemática es utilizada también en diseño gráfico cuando se habla de modelos geométricos de los objetos en dos (2D) o tres dimensiones (3D).

Modelo matemático

De Wikipedia, la enciclopedia libre

En ciencias aplicadas, un Modelo matemático es uno de los tipos de modelos científicos, que emplea algún tipo de formulismo matemático para expresar relaciones, proposiciones sustantivas de hechos, variables, parámetros, entidades y relaciones entre variables y/o entidades u operaciones, para estudiar comportamientos de sistemas complejos ante situaciones difíciles de observar en la realidad. El término modelización matemática es utilizada también en diseño gráfico cuando se habla de modelos geométricos de los objetos en dos (2D) o tres dimensiones (3D).

El significado de modelo matemático en matemática fundamental, sin embargo, es algo diferente. En concreto en matemáticas se trabajan con modelos formales. Un modelo formal para una cierta teoría matemática es un conjunto sobre el que se han definido un conjunto de relaciones unarias, binarias y trinarias, que satisface las proposiciones derivadas del conjunto de axiomas de la teoría. La rama de la matemática que se encarga de estudiar sistemáticamente las propiedades de los modelos es la teoría de modelos.

Contenido

[ocultar]

[editar] Clasificaciones de los modelos

Se podría decir que un modelo de las ciencias físicas es una traducción de la realidad física de un sistema en términos matemáticos, es decir, una forma de representar cada uno de los tipos entidades que intervienen en un cierto proceso físico mediante objetos matemáticos. Las relaciones matemáticas formales entre los objetos del modelo, deben representar de alguna manera las relaciones reales existentes entre las diferentes entidades o aspectos del sistema u objeto real. Así una vez "traducido" o "representado" cierto problema en forma de modelo matemático, se pueden aplicar el cálculo, el álgebra y otras herramientas matemáticas para deducir el comportamiento del sistema bajo estudio. Un modelo físico requerirá por tanto que se pueda seguir el camino inverso al modelado, permitiendo reinterpretar en la realidad las predicciones del modelo.

[editar] Según la información de entrada

Con respecto a la función del origen de la información utilizada para construirlos los modelos pueden clasificarse de otras formas. Podemos distinguir entre modelos heurísticos y modelos empíricos:

  • Modelos heurísticos (del griego euriskein 'hallar, inventar'). Son los que están basados en las explicaciones sobre las causas o mecanismos naturales que dan lugar al fenómeno estudiado.
  • Modelos empíricos (del griego empeirikos relativo a la 'experiencia'). Son los que utilizan las observaciones directas o los resultados de experimentos del fenómeno estudiado.

[editar] Según el tipo de representación

Además los modelos matemáticos encuentran distintas denominaciones en sus diversas aplicaciones. Una posible clasificación puede atender a si pretenden hacer predicciones de tipo cualitativo o pretende cuantificar aspectos del sistema que se está modelizando:

  • Modelos cualitativos o conceptuales, estos pueden usar figuras, gráficos o descripciones causales, en general se contentan con predecir si el estado del sistema irá en determinada dirección o si aumentará o disminuirá alguna magnitud, sin importar exactamente la magnitud concreta de la mayoría de aspectos.
  • Modelos cuantitativos o numéricos, usan números para representar aspectos del sistema modelizado, y generalmente incluyen fórmulas y algoritmos matemáticos más o menos complejos que relacionan los valores numéricos. El cálculo con los mismos permite representar el proceso físico o los cambios cuantitativos del sistema modelado.

[editar] Según la aleaotoriedad

Otra clasificación independiente de la anterior, según si a un input o situación inicial concreta pueden corresponder o no diversos output o resultados, en este caso los modelos se clasifican en:

  • Determinista. Se conoce de manera puntual la forma del resultado ya que no hay incertidumbre. Además, los datos utilizados para alimentar el modelo son completamente conocidos y determinados.
  • Estocástico. Probabilístico, que no se conoce el resultado esperado, sino su probabilidad y existe por tanto incertidumbre.

[editar] Clasificación según su aplicación u objetivo

Por su uso suelen utilizarse en las siguientes tres áreas, sin embargo existen muchas otras como la de finanzas, ciencias etc.

  • Modelo de simulación o descriptivo, de situaciones medibles de manera precisa o aleatoria, por ejemplo con aspectos de programación líneal cuando es de manera precisa, y probabilística o heurística cuando es aleatorio. Este tipo de modelos pretende predecir qué sucede en una situación concreta dada.
  • Modelo de optimización. Para determinar el punto exacto para resolver alguna problemática administrativa, de producción, o cualquier otra situación. Cuando la optimización es entera o no lineal, combinada, se refiere a modelos matemáticos poco predecibles, pero que pueden acoplarse a alguna alternativa existente y aproximada en su cuantificación. Este tipo de modelos requiere comparar diversas condicones, casos o posibles valores de un parámetro y ver cual de ellos resulta óptimo según el criterio elegido.
  • Modelo de control. Para saber con precisión como está algo en una organización, investigación, área de operación, etc. Este modelo pretende ayudar a decidir qué nuevas medidas, variables o qué parámetros deben ajustarse para lograr un resultado o estado concreto del sistema modelado.

[editar] Ejemplos

Un modelo mixto operacional estadístico es una teoría o situación causal de hechos y expresado con símbolos de formato matemático. Por ejemplo las tablas de contingencia. De hecho los modelos matemáticos se construyen con varios niveles de significación y con diferentes variables.

Kendall y Buckland catalogan hasta 40 tipos diferentes de modelos matemáticos. Ejemplos: Rapoport en modelo matemático e interacción social en 1961 y Bugeda en Sociología matemática en 1970. Por un principio de isomorfismo hay una equivalencia, a conseguir, entre un modelo y una teoría. Además teoría y modelo son sinónimos.

[editar] Ejemplos de modelos por tipos

 Descriptivos/SimulaciónOptimización/ElecciónControl/Tratamiento
DeterministaProbabilistaDeterministaProbabilistaDeterministaProbabilista
CuantitativoCálculos
astronómicos
Simulaciones
de tráfico
Cálculo componentes
de sistemas
Diseño ingenierilControl
automático
 ?
CualitativoAnálisis
microeconómicos
Teoría de
juegos
 ? ?Teoría
psicológica
 ?

[editar] Modelo matemático de simulación hidrológica

Se utilizan para estudiar situaciones extremas, difícilmente observables en la realidad, como por ejemplo los efectos de precipitaciones muy intensas y prolongadas en cuencas hidrográficas, en su estado natural, o en las que se ha intervenido con obras como canales, represas, diques de contención, puentes, etc.

La cuenca hidrográfica es dividida en sub-cuencas consideradas homogéneas desde el punto de vista: del tipo de suelo, de la declividad, de su cobertura vegetal. El número y tipo de las variables hidrológicas que intervienen en el modelo son función de objetivo específico para el cual se elabora el mismo.

[editar] Fases de construcción de un modelo

En muchos casos la construcción o creación de modelos matemáticos útiles sigue una serie de fases bien determindas:

  1. Identificación de un problema o situación compleja que necesita ser simulada, optimizada o controlada y por tanto requeriría un modelo matemático predictivo.
  2. Elección del tipo de modelo, esto requiere precisar qué tipo de respuesta u output pretende obtenerse, cuales son los datos de entrada o factores relevantes, y para qué pretende usarse el modelo. Esta elección debe ser suficientemente simple como para permitir un tratamiento matemático asequible con los recursos disponibles. Esta fase requiere además identificar el mayor número de datos fidedignos, rotular y clasificar las incógnitas (variables independientes y dependientes) y establecer consideraciones, físicas, químicas, geométricas, etc. que representen adecuadamente el fenómeno en estudio.
  3. Formalización del modelo en la que se detallarán qué forma tienen los datos de entrada, qué tipo de herramienta matemática se usará, como se adaptan a la información previa existente. También podría incluir la confección de algoritmos, ensamblaje de archivos informáticos, etc, etc. En esta fase posiblemente se introduzcan también simplificaciones suficientes para que el problema matemático de modelización sea tratable computacionalmente.
  4. Comparación de resultados los resultados obtenidos como predicciones necesitan ser comparados con los hechos observados para ver si el modelo está prediciendo bien. Si los resultados no se ajustan bien, frecuentemente se vuelve a la fase 1.

Es importante mencionar que la inmensa mayoría de modelos matemáticos no son exactos y tienen un alto grao de idealización y simplificación, ya que una modelización muy exacta puede ser más complicada de tratar de una simplificación conveniente y por tanto menos útil.

[editar] Véase también

[editar] Referencias

[editar] Bibliografía

  • Ríos, Sixto (1995). Modelización. Alianza Universidad. ISBN 978-84-206-2822-6. 
  • Stewart, James (2002): "Cálculo, Trascendentes Tempranas". 4 ed. Tr. de Andrés Sestier. México, Ed. Thomson, p. 1151
  • Guillermo Duran: Investigación de operaciones, modelos matemáticos y optimización, Centro de Gestión de Operaciones, Departamento de Ingeniería Industrial, Universidad de Chile.

[editar] Enlaces externos

26/09/2010 14:45 petalofucsia #. Matemáticas Hay 1 comentario.

MATEMÁTICAS: Mi Gran Cerebro: campeona de ajedrez. Documental de National Geographic sobre la inteligencia humana. Esta sección trata sobre Susan Polgar, campeona y hermana de campeones en la disciplina del ajedrez.

Documental de National Geographic sobre la inteligencia humana. Esta sección trata sobre Susan Polgar, campeona y hermana de campeones en la disciplina del ajedrez.

Obtenido de http://www.youtube.com/watch?v=iWK69yfDwUs&feature=related

23/09/2010 15:15 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: SUCESIÓN DE FIBONACCI. ¿QUÉ PASA SI A LA SUCESIÓN DE FIBONACCI LE ASIGNAMOS FUNCIONES?. A cada elemento de esta sucesión se le llama número de Fibonacci. Esta sucesión fue descrita en Europa por Leonardo de Pisa, matemático italiano del siglo XIII también conocido como Fibonacci. Tiene numerosas aplicaciones en ciencias de la computación, matemáticas y teoría de juegos. También aparece en configuraciones biológicas, como por ejemplo en las ramas de los árboles, en la disposición de las hojas en el tallo, en la flora de la alcachofa y en el arreglo de un cono.

Sucesión de Fibonacci

De Wikipedia, la enciclopedia libre
Gráfica de la sucesión de Fibonacci hasta f10

En matemáticas, la sucesión de Fibonacci es la siguiente sucesión infinita de números naturales:

0,1,1,2,3,5,8,13,21,34,55,89,144 ldots ,

La sucesión inicia con 0 y 1, y a partir de ahí cada elemento es la suma de los dos anteriores.

A cada elemento de esta sucesión se le llama número de Fibonacci. Esta sucesión fue descrita en Europa por Leonardo de Pisa, matemático italiano del siglo XIII también conocido como Fibonacci. Tiene numerosas aplicaciones en ciencias de la computación, matemáticas y teoría de juegos. También aparece en configuraciones biológicas, como por ejemplo en las ramas de los árboles, en la disposición de las hojas en el tallo, en la flora de la alcachofa y en el arreglo de un cono.

Contenido

[ocultar]

[editar] Historia

La sucesión de Fibonacci en términos de conejos.

Antes de que Fibonacci escribiera su trabajo, la sucesión de los números de Fibonacci había sido descubierta por matemáticos indios tales como Pingala (200 a.c.), Gopala (antes de 1135) y Hemachandra (c. 1150), quienes habían investigado los patrones rítmicos que se formaban con sílabas o notas de uno o dos pulsos. El número de tales ritmos (teniendo juntos una cantidad n de pulsos) era fn + 1, que produce explícitamente los números 1, 2, 3, 5, 8, 13, 21, etc.[1]

La sucesión fue descrita por Fibonacci como la solución a un problema de la cría de conejos: "Cierto hombre tenía una pareja de conejos juntos en un lugar cerrado y uno desea saber cuántos son creados a partir de este par en un año cuando es su naturaleza parir otro par en un simple mes, y en el segundo mes los nacidos parir también".[2]

Dicho de otra forma, sirve para conocer el número de conejos (parejas de conejos) que habrá en 12 meses, si estos se reproducen continuamente y cada pareja de conejos produce una nueva pareja de conejos (un macho y una hembra). Cada conejo se puede cruzar a la edad de un mes, siendo su periodo de gestación un mes. Siendo así, se tiene que:

Número de MesExplicación de la genealogíaParejas de conejos totales
Fin del mes 00 conejos vivos.0 parejas en total.
Comienzo del mes 1Nace una pareja de conejos (pareja A).1 pareja en total.
Fin del mes 1La pareja A tiene un mes de edad. Se cruza la pareja A.1+0=1 pareja en total.
Fin del mes 2La pareja A da a luz a la pareja B. Se vuelve a cruzar la pareja A.1+1=2 parejas en total.
Fin del mes 3La pareja A da a luz a la pareja C. La pareja B cumple 1 mes. Se cruzan las parejas A y B.2+1=3 parejas en total.
Fin del mes 4Las parejas A y B dan a luz a D y E. La pareja C cumple 1 mes. Se cruzan las parejas A, B y C.3+2=5 parejas en total.
Fin del mes 5A, B y C dan a luz a F, G y H. D y E cumplen un mes. Se cruzan A, B, C, D y E.5+3=8 parejas en total.
Fin del mes 6A, B, C, D y E dan a luz a I, J, K, L y M. F, G y H cumplen un mes. Se cruzan A, B, C, D, E, F, G y H.8+5=13 parejas en total.
.........
Fin del mes 12......

Nota: al contar la cantidad de letras distintas en cada mes, se puede saber la cantidad de parejas totales que hay hasta ese mes.

De esta manera Fibonacci presentó la sucesión en su libro Liber Abaci, publicado en 1202. Muchas propiedades de la sucesión de Fibonacci fueron descubiertas por Édouard Lucas, responsable de haberla denominado como se la conoce en la actualidad.[3]

También Kepler describió los números de Fibonacci, y el matemático escocés Robert Simson descubrió en 1753 que la relación entre dos números de Fibonacci sucesivos fn + 1 / fn se acerca a la relación áurea fi (varphi) cuanto más se acerque a infinito; es más: el cociente de dos términos sucesivos de toda sucesión recurrente de orden dos tiende al mismo límite. Esta serie ha tenido popularidad en el siglo XX especialmente en el ámbito musical, en el que compositores con tanto renombre como Béla Bartók, Olivier Messiaen y Delia Derbyshire la han utilizado para la creación de acordes y de nuevas estructuras de frases musicales.

[editar] Definición formal

Chimenea con la secuencia de Fibonacci

Los números de Fibonacci f_0,f_1,f_2,f_3,dots quedan definidos por las ecuaciones

(1) f_0=0,

(2) f_1=1,

(3) f_n = f_{n-1} + f_{n-2}, para n = 2,3,4,5,ldots

Esto produce los números

  • f_0 = 0,
  • f_1 = 1,
  • f_2 = 1,
  • f_3 = 2,
  • f_4 = 3,
  • f_5 = 5,
  • f_6 = 8,
  • f_7 = 13,
  • f_8 = 21,

y así sucesivamente de manera infinita.

[editar] Representaciones alternativas

Para analizar la sucesión de Fibonacci (y, en general, cualquier sucesión) es conveniente obtener otras maneras de representarla matemáticamente.

[editar] Función generadora

Una función generadora para una sucesión cualquiera a_0,a_1,a_2,dots es la función f(x) = a_0+a_1x+a_2x^2+a_3x^3+a_4x^4+cdots, es decir, una serie de potencias donde cada coeficiente es un elemento de la sucesión. Los números de Fibonacci tienen la función generadora

(4) fleft(xright)=frac{x}{1-x-x^2}

Cuando esta función se expande en potencias de x,, los coeficientes resultan ser la sucesión de Fibonacci:

frac{x}{1-x-x^2}=0x^0+1x^1+1x^2+2x^3+3x^4+5x^5+8x^6+13x^7+cdots

[editar] Fórmula explícita

La definición de la sucesión de Fibonacci es recurrente; es decir que se necesitan calcular varios términos anteriores para poder calcular un término específico. Se puede obtener una fórmula explícita de la sucesión de Fibonacci (que no requiere calcular términos anteriores) notando que las ecuaciones (1), (2) y (3) definen la relación de recurrencia

f_{n+2}-f_{n+1}-f_n=0,

con las condiciones iniciales

f_0=0, y f_1=1,

El polinomio característico de esta relación de recurrencia es t2t − 1 = 0, y sus raíces son

t=frac{1pmsqrt 5}{2}

De esta manera, la fórmula explícita de la sucesión de Fibonacci tendrá la forma

f_n=bleft(frac{1+sqrt5}2right)^n+dleft(frac{1-sqrt5}2right)^n

Si se toman en cuenta las condiciones iniciales, entonces las constantes b y d satisfacen la ecuación anterior cuando n = 0 y n = 1, es decir que satisfacen el sistema de ecuaciones

left.begin{array}{rcl}b+d & = & 0  bleft(frac{1+sqrt5}2right)+dleft(frac{1-sqrt5}2right)&=&1end{array}right}

Al resolver este sistema de ecuaciones se obtiene

b=frac1{sqrt5},d=-frac1{sqrt5}

Por lo tanto, cada número de la sucesión de Fibonacci puede ser expresado como

(5) f_n=frac1{sqrt5}left(frac{1+sqrt5}2right)^n-frac1{sqrt5}left(frac{1-sqrt5}2right)^n

Para simplificar aún más es necesario considerar el número áureo

varphi=frac{1+sqrt5}2

de manera que la ecuación (5) se reduce a

(6) f_n=frac{varphi^n-left(1-varphiright)^{n}}{sqrt5}

Esta fórmula se le atribuye a Édouard Lucas, y es fácilmente demostrable por inducción matemática. A pesar de que la sucesión de Fibonacci consta únicamente de números naturales, su fórmula explícita incluye al número irracional varphi,. De hecho, la relación con este número es estrecha.

[editar] Forma matricial

Otra manera de obtener la sucesión de Fibonacci es considerando el sistema lineal de ecuaciones

left . begin{array}{rcl}           f_{n} &=& f_{n}  f_{n-1} + f_{n} &=& f_{n+1} end{array} right }

Este sistema se puede representar mediante su notación matricial como

begin{bmatrix}0&11&1end{bmatrix}begin{bmatrix}f_{n-1}f_{n}end{bmatrix} = begin{bmatrix}f_{n}f_{n+1}end{bmatrix}

Conociendo a f0 = 0 y f1 = 1, al aplicar la fórmula anterior n veces se obtiene

(7) begin{bmatrix}0&11&1end{bmatrix}^nbegin{bmatrix}01end{bmatrix} = begin{bmatrix}f_{n}f_{n+1}end{bmatrix}

Una vez aquí, simplemente tenemos que diagonalizar la matriz, facilitando así la operación de potenciación, y obteniendo por tanto la fórmula explícita para la sucesión que se especificó arriba.

y más aún

(8) begin{bmatrix}0&11&1end{bmatrix}^n=begin{bmatrix}f_{n-1}&f_nf_n&f_{n+1}end{bmatrix}

Estas igualdades pueden probarse mediante inducción matemática.

[editar] Propiedades de la sucesión

Al construir bloques cuya longitud de lado sean números de Fibonacci se obtiene un dibujo que asemeja al rectángulo áureo (véase Número áureo).

Los números de Fibonacci aparecen en numerosas aplicaciones de diferentes áreas. Por ejemplo, en modelos de la crianza de conejos o de plantas, al contar el número de cadenas de bits de longitud n que no tienen ceros consecutivos y en una vasta cantidad de contextos diferentes. De hecho, existe una publicación especializada llamada Fibonacci Quarterly[4] dedicada al estudio de la sucesión de Fibonacci y temas afines. Se trata de un tributo a cuán ampliamente los números de Fibonacci aparecen en matemáticas y sus aplicaciones en otras áreas. Algunas de las propiedades de esta sucesión son las siguientes:

  • La razón o cociente entre un término y el inmediatamente anterior varía continuamente, pero se estabiliza en el número áureo. Es decir:

lim_{ntoinfty}frac{f_{n+1}}{f_n}=varphi

Este límite no es privativo de la Sucesión de Fibonacci. Cualquier sucesión recurrente de orden 2, como la sucesión 3, 4, 7, 11, 18,..., lleva al mismo límite. Esto fue demostrado por Barr y Schooling en una carta publicada en la revista londinense "The Field" del 14 de diciembre de 1912. Los cocientes son oscilantes; es decir, que un cociente es menor al límite y el siguiente es mayor. Los cocientes pueden ordenarse en dos sucesiones que se aproximan asintóticamente por exceso y por defecto al valor límite.
  • Cualquier número natural se puede escribir mediante la suma de un número limitado de términos de la sucesión de Fibonacci, cada uno de ellos distinto a los demás. Por ejemplo, 17 = 13 + 3 + 1, 65 = 55 + 8 + 2.
  • Tan sólo un término de cada tres es par, uno de cada cuatro es múltiplo de 3, uno de cada cinco es múltiplo de 5, etc. Esto se puede generalizar, de forma que la sucesión de Fibonacci es periódica en las congruencias módulo m, para cualquier m.
  • La sucesión puede expresarse mediante otra fórmula explícita llamada forma de Binet (de Jacques Binet). Si textstylealpha = frac{1+sqrt 5}{2} y textstylebeta = frac{1-sqrt 5}{2}, entonces
f_n=frac{alpha^n-beta^n}{alpha-beta} y f_napproxfrac{alpha^n}{sqrt 5},
  • Cada número de Fibonacci es el promedio del término que se encuentra dos posiciones antes y el término que se encuentra una posición después. Es decir
f_n=frac{f_{n-2}+f_{n+1}}2
  • Lo anterior también puede expresarse así: calcular el siguiente número a uno dado es 2 veces éste número menos el número 2 posiciones más atrás:fn + 1 = fn * 2 − fn − 2
  • La suma de los n primeros números es igual al número que ocupa la posición n + 2 menos uno. Es decir
f_0+f_1+f_2+cdots+f_n=f_{n+2}-1
  • Otras identidades interesantes incluyen las siguientes:
f_0-f_1+f_2-cdots+(-1)^nf_n=(-1)^nf_{n-1}-1

 

f_1+f_3+f_5+cdots+f_{2n-1}=f_{2n}

 

f_0+f_2+f_4+cdots+f_{2n}=f_{2n+1}-1

 

f_0^2+f_1^2+f_2^2+cdots+f_n^2=f_nf_{n+1}

 

f_1f_2+f_2f_3+f_3f_4+cdots+f_{2n-1}f_{2n}=f_{2n}^2

 

f_1f_2+f_2f_3+f_3f_4+cdots+f_{2n}f_{2n+1}=f_{2n+1}^2-1

 

Si kgeq1, entonces f_{n+k}=f_kf_{n+1}+f_{k-1}f_n, para cualquier ngeq0

 

f_{n+1}f_{n-1}-f_n^2=(-1)^n (Identidad de Cassini)

 

f_{n+1}^2+f_n^2=f_{2n+1}

 

f_{n+2}^2-f_{n+1}^2=f_nf_{n+3}
Phi forma parte de una expresión de la sucesión de Fibonacci.

 

f_{n+2}^2-f_n^2=f_{2n+2}

 

f_{n+2}^3+f_{n+1}^3-f_n^3=f_{3n+3}

 

f_{n}=varphi ^{n+1}-(f_{n+1})varphi (con φ = número áureo)

 

mathrm{mcd}left(f_n,f_mright)=f_{mathrm{mcd}left(n,mright)}Esto significa que f_n, y f_{n+1}, son primos relativos y que f_k, divide exactamente a f_{nk},
  • Los números de Fibonacci aparecen al sumar las diagonales del triángulo de Pascal. Es decir que para cualquier ngeq0,
f_{n+1}=sum_{j=0}^{leftlfloorfrac n 2rightrfloor}begin{pmatrix}n-jjend{pmatrix}y más aúnf_{3n}=sum_{j=0}^nbegin{pmatrix}njend{pmatrix}2^jf_j
  • Si fp = a, tal que a es un número primo, entonces p también es un número primo, con una única excepción, f4 = 3; 3 es un número primo, pero 4 no lo es.
  • La suma infinita de los términos de la sucesión textstylefrac{f_n}{10^n} es exactamente textstylefrac{10}{89}.
  • La suma de diez números Fibonacci consecutivos es siempre 11 veces superior al séptimo número de la serie.
  • El último dígito de cada número se repite periódicamente cada 60 números. Los dos últimos, cada 300; a partir de ahí, se repiten cada 15times10^{n-1} números.

[editar] Generalización

Gráfica de la sucesión de Fibonacci extendida al campo de los números reales.

El concepto fundamental de la sucesión de Fibonacci es que cada elemento es la suma de los dos anteriores. En este sentido la sucesión puede expandirse al conjunto de los números enteros como ldots,-8,5,-3,2,-1,1,0,1,1,2,3,5,8,ldots de manera que la suma de cualesquiera dos números consecutivos es el inmediato siguiente. Para poder definir los índices negativos de la sucesión, se despeja f_{n-2}, de la ecuación (3) de donde se obtiene

f_{n-2}=f_n-f_{n-1},

De esta manera, f_{-n}=f_n, si n es impar y f_{-n}=-f_n, si n es par.

La sucesión se puede expandir al campo de los números reales tomando la parte real de la fórmula explícita (ecuación (6)) cuando n es cualquier número real. La función resultante

f(x)=frac{varphi^x-cos(pi x)varphi^{-x}}{sqrt 5}

tiene las mismas características que la sucesión de Fibonacci:

  • f(0)=0~
  • f(1)=1~
  • f(x)=f(x-1)+f(x-2)~ para cualquier número real x

Una sucesión de Fibonacci generalizada es una sucesión g_0,g_1,g_2,ldots donde

(9) g_n=g_{n-1}+g_{n-2}, para n=2,3,4,5,ldots

Es decir, cada elemento de una sucesión de Fibonacci generalizada es la suma de los dos anteriores, pero no necesariamente comienza en 0 y 1.

Una característica notable es que, si g_0,g_1,g_2,ldots es una sucesión de Fibonacci generalizada, entonces

g_n=f_{n-1}g_0+f_ng_1~

Por ejemplo, la ecuación (7) puede generalizarse a

begin{bmatrix}0&11&1end{bmatrix}^nbegin{bmatrix}g_0g_1end{bmatrix} = begin{bmatrix}g_{n}g_{n+1}end{bmatrix}

Esto significa que cualquier cálculo sobre una sucesión de Fibonacci generalizada se puede efectuar usando números de Fibonacci.

[editar] Sucesión de Lucas

Gráfica de la sucesión de Lucas extendida al campo de los números reales.

Un ejemplo de sucesión de Fibonacci generalizada es la sucesión de Lucas, descrita por las ecuaciones

  • l_0=2~
  • l_1=1~
  • l_n=l_{n-1}+l_{n-2}~ para n=2,3,4,5,ldots

La sucesión de Lucas tiene una gran similitud con la sucesión de Fibonacci y comparte muchas de sus características. Algunas propiedades interesantes incluyen:

  • La proporción entre un número de Lucas y su sucesor inmediato se aproxima al número áureo. Es decir
lim_{ntoinfty}frac{l_{n+1}}{l_n}=varphi
  • La fórmula explícita para la sucesión de Lucas es
l_n=varphi^n+(-varphi)^{-n}
  • La suma de los primeros n números de Lucas es el número que se encuentra en la posición n + 2 menos uno. Es decir
l_0+l_1+l_2+cdots+l_n=l_{n+2}-1
  • Cualquier fórmula que contenga un número de Lucas puede expresarse en términos de números de Fibonacci mediante la igualdad
l_n=f_{n-1}+f_{n+1}~
  • Cualquier fórmula que contenga un número de Fibonacci puede expresarse en términos de números de Lucas mediante la igualdad
f_n=frac{l_{n-1}+l_{n+1}}{5}

[editar] Algoritmos de cálculo

Calculando f7 usando el algoritmo 1.

Para calcular el n-ésimo elemento de la sucesión de Fibonacci existen varios algoritmos (métodos). La definición misma puede emplearse como uno, aquí expresado en pseudocódigo:

Algoritmo 1 Versión recursiva (Complejidad O(varphi^n),)

función {it fib}(n),

si n<2, entonces devuelve n,si no devuelve {it fib}(n-1) + {it fib}(n-2),

Usando técnicas de análisis de algoritmos es posible demostrar que, a pesar de su simplicidad, el algoritmo 1 requiere efectuar fn + 1 − 1 sumas para poder encontrar el resultado. Dado que la sucesión fn crece tan rápido como varphi^n, entonces el algoritmo está en el orden de varphi^n. Es decir, que este algoritmo es muy lento. Por ejemplo, para calcular f50 este algoritmo requiere efectuar 20365011073 sumas.

Para evitar hacer tantas cuentas, es común recurrir a una calculadora y utilizar la ecuación (6), sin embargo, dado que varphi es un número irracional, la única manera de utilizar esta fórmula es utilizando una aproximación de varphi y obteniendo en consecuencia un resultado aproximado pero incorrecto. Por ejemplo, si se usa una calculadora de 10 dígitos, entonces la fórmula anterior arroja como resultado f_{50}=1.258626903times10^{10} aun cuando el resultado correcto es f50 = 12586269025. Este error se hace cada vez más grande conforme crece n.

Un método más práctico evitaría calcular las mismas sumas más de una vez. Considerando un par (i,j), de números consecutivos de la sucesión de Fibonacci, el siguiente par de la sucesión es (j,i+j),, de esta manera se divisa un algoritmo donde sólo se requiere considerar dos números consecutivos de la sucesión de Fibonacci en cada paso. Este método es el que usaríamos normalmente para hacer el cálculo a lápiz y papel. El algoritmo se expresa en pseudocódigo como:

Algoritmo 2 Versión iterativa (Complejidad O(n),)

función {it fib}(n),

igets 1jgets 0para k, desde 1, hasta n, hacer tgets i+jigets jjgets tdevuelve j,

Esta versión requiere efectuar sólo n sumas para calcular fn, lo cual significa que este método es considerablemente más rápido que el algoritmo 1. Por ejemplo, el algoritmo 2 sólo se requiere efectuar 50 sumas para calcular f50.

Calculando f100 usando el algoritmo 3.

Un algoritmo todavía más rápido se sigue partiendo de la ecuación (8). Utilizando leyes de exponentes es posible calcular xn como

x^n=begin{cases} x & mbox{si }n=1  left(x^{frac n 2}right)^2 & mbox{si }nmbox{ es par}  xtimes x^{n-1} & mbox{si }nmbox{ es impar} end{cases}

De esta manera se divisa el algoritmo de tipo Divide y Vencerás donde sólo se requeriría hacer, aproximadamente, log2(n) multiplicaciones matriciales. Sin embargo, no es necesario almacenar los cuatro valores de cada matriz dado que cada una tiene la forma

begin{bmatrix} a & b  b & a+b end{bmatrix}

De esta manera, cada matriz queda completamente representada por los valores a y b, y su cuadrado se puede calcular como

begin{bmatrix} a & b  b & a+b end{bmatrix}^2 =  begin{bmatrix}a^2+b^2 & b(2a+b) b(2a+b) & (a+b)^2+b^2end{bmatrix}

Por lo tanto el algoritmo queda como sigue:

Algoritmo 3 Versión Divide y Vencerás (Complejidad O(log(n)),)

función {it fib}(n),

si nleq0 entonces devuelve 0,igets n-1(a,b) gets (1,0)(c,d) gets (0,1)mientras i > 0, hacer si i, es impar entonces (a,b) gets (db + ca, d(b + a) + cb)(c,d) gets (c^2 + d^2, d(2c + d))igets idiv 2devuelve a+b,

A pesar de lo engorroso que parezca, este algoritmo permite reducir enormemente el número de operaciones que se necesitan para calcular números de Fibonacci muy grandes. Por ejemplo, para calcular f100, en vez de hacer las 573147844013817084100 sumas del algoritmo 1 o las 100 sumas con el algoritmo 2, el cálculo se reduce a tan sólo 9 multiplicaciones matriciales.

[editar] La sucesión de Fibonacci en la cultura popular

Sucesión de Fibonacci in art, Martina Schettina 2008, 40 x 40 cm
  • En la pág. 61 de la novela de Dan Brown El código Da Vinci aparece una versión desordenada de los primeros ocho números de Fibonacci (13, 3, 2, 21, 1, 1, 8, 5), que funcionan como una pista dejada por el conservador del museo del Louvre, Jacques Saunière.
  • En el álbum Lateralus de la banda estadounidense Tool, los patrones de la batería (Danny Carey) de la canción "Lateralus" siguen la Sucesión de Fibonacci del número 13 (número de pistas del disco): 1,1,2,3,5,8,13,1,1,2,3,5,8,13,1,1,...
  • En la miniserie Taken, la Sucesión de Fibonacci, como la Ecuación de Dios, es descubierta en los planes de los extraterrestres, en ejemplos como que sus naves tienen 5 tripulantes, sus manos 3 dedos y un pulgar, 1597 avistamientos ovnis en año anterior, se siguieron a 55 parejas para descubrir la hibrida humano-extraterrestre Allie, y que finalmente el número de abducidos era de 46368. Incidentalmente se habla en de un hombre que fue abducido 13 veces. 1, 3, 5, 13, 55, 1597, 46368, todos números Fibonacci.
  • En el filme de Darren Aronofsky π el orden del caos el judío Rabbi Cohen presenta la teoría en hebreo transcrito en números en la cual el personaje Max Cohen relaciona esta última teoría con la secuencia de Fibonacci llegando en conclusión que todo esta basado en la ley del orden y el caos.
  • En un lateral de la cúpula de la antigua sinagoga ahora convertida en el Museo Nazionale del Cinema, más conocida como Mole Antonelliana, en Torino (Italia), se puede observar una instalación luminosa de la sucesión de números de Fibonacci.
  • El Dr. Walter Bishop de la serie de televisón Fringe usa numeros de la serie de Fibonacci para las contraseñas de sus cajas de seguridad.
  • En el videojuego de Assasins Creed 2, en uno de los acertijos de los glifos para resolverlo se debe usar la suceción de Fibonaccci para poder resolverlo

[editar] La sucesión de Fibonacci en la naturaleza

La gran mayoría de los árboles parecen crecer siguiendo la sucesión de fibonacci: El tronco (1) se divide en una rama grande (1), esta rama se divide en dos (2), luego, cada una de ellas se divide en 3 (3) ramas más pequeñas, y así sucesivamente.

El Sistema Solar pareciera seguir este patrón: Mercurio (1), Venus (1), La Tierra (2, incluyendo La Luna), Marte (3, incluyendo Fobos y Deimos). Hasta aquí la semejanza, pues el planeta que sigue en el Sistema Solar (Júpiter) tiene más de 60 satélites conocidos. Sin embargo, sólo 4 de ellos son observables fácilmente (Io, Europa, Ganímedes y Calisto), dado que los otros son marcadamente más pequeños. Así, podemos extender hasta el número 5 la presencia de la serie de Fibonacci en nuestro Sistema Solar.

En el cuerpo humano podemos decir que la cabeza es 1, el cuello, 1, los brazos (2), brazo, antebrazo y mano (3), luego los cinco dedos (5), es decir, la sucesión de Fibonacci hasta el 5.

Los machos de una colmena de abejas tienen un árbol genealógico que cumple con esta sucesión. El hecho es que los zánganos, el macho de la abeja, no tiene padre (1), pero sí que tiene una madre (1, 1), dos abuelos, que son los padres de la reina (1, 1, 2), tres bisabuelos, ya que el padre de la reina no tiene padre (1, 1, 2, 3), cinco tatarabuelos (1, 1, 2, 3, 5), ocho tataratatarabuelos (1, 1, 2, 3, 5, 8) y así sucesivamente, cumpliendo con la sucesión de Fibonacci.

[editar] Referencias

  1. Knuth, 1997, pág. 80
  2. Laurence Sigler, Fibonacci's Liber Abaci, página 404
  3. Handbook of discrete and combinatorial mathematics, sección 3.1.2
  4. Fibonacci Quarterly

[editar] Bibiliografía

  • Kolman, Bernard; Hill, David R. (2006). Álgebra Lineal. México: PEARSON EDUCACIÓN. ISBN 970-26-0696-9. 
  • Johnsonbaugh, Richard (2005). Matemáticas Discretas. México: PEARSON EDUCACIÓN. ISBN 970-26-0637-3. 
  • Brassard, G; Bratley, P. (1997). Fundamentos de Algoritmia. Madrid: PRETINCE HALL. ISBN 84-89660-00-X. 
  • Kenneth, H. Rosen (2003). Discrete mathematics and its applications. McGraw Hill. ISBN 0-07-123374-1. 
  • Kenneth H. Rosen; John G. Michaels (1999). Handbook of discrete and combinatorial mathematics. CRC. ISBN 0-8493-0149-1. 
  • N. N. Vorobiov (1974). Números de Fibonacci. Editorial Mir, Moscú, Colección Lecciones Populares de Matemáticas. Traducción al español de Carlos Vega, catedrático de Matemáticas Superiores y candidato a doctor en ciencias físico-matemáticas. 
  • A. I. Markushevich (1974; 1981). Sucesiones recurrentes. Editorial Mir, Moscú, Colección Lecciones Populares de Matemáticas. Traducción al español de Carlos Vega. 
  • Luca Pacioli (1946). La Divina Proporción. Editorial Losada, Buenos Aires. 

[editar] Véase también

[editar] Enlaces externos

23/09/2010 14:59 petalofucsia #. Matemáticas Hay 2 comentarios.

MATEMÁTICAS: PARESE A OBSERVAR TODOS LOS COMPORTAMIENTOS QUE SON NORMALES Y LINGÜÍSTICAMENTE TODO LO QUE SE CONSIDERA NORMAL, USANDO DICCIONARIOS U OTROS MÉTODOS. ¿ES UNA RELACIÓN DE CAUSALIDAD TAMBIÉN? ¿QUÉ OPINA? ¿DE CAUSA Y EFECTO? En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.

Distribución normal

De Wikipedia, la enciclopedia libre
Distribución normal
Función de densidad de probabilidad
Probability density function for the normal distribution
La línea verde corresponde a la distribución normal estandar
Función de distribución de probabilidad
Cumulative distribution function for the normal distribution
Parámetrosmu inmathbb{R} ,!
σ > 0
Dominiox inmathbb{R} ,!
Función de densidad (pdf)frac1{sigmasqrt{2pi}}; e^{ - frac{1}{2} left(frac{x-mu}{sigma}right)^2}  ,!
Función de distribución (cdf)intlimits_{-infty}^{x} frac1{sigmasqrt{2pi}}; e^{ - frac{1}{2} left(frac{t-mu}{sigma}right)^2}    , dt ,!
Mediamu ,!
Medianamu ,!
Modamu ,!
Varianzasigma^2 ,!
Coeficiente de simetría0
Curtosis0
Entropíalnleft(sigmasqrt{2,pi,e}right)  ,!
Función generadora de momentos (mgf)M_X(t)= e^{mu,t+frac{sigma^2 t^2}{2}} ,!
Función característicachi_X(t)=e^{mu,i,t-frac{sigma^2 t^2}{2}} ,!

En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro. Esta curva se conoce como campana de Gauss.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.

De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea coocido como método correlacional.

La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.

Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:

La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal, incluso si la distribución de la población de la cual se extrae la muestra no es normal.[1] Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una supuesta "normalidad".

En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continuas y discretas.

Contenido

[ocultar]

[editar] Historia

Abraham de Moivre, descubridor de la distribución normal

La distribución normal fue presentada por vez primera por Abraham de Moivre en un artículo del año 1733,[2] que fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teoría analítica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace.

Laplace usó la distribución normal en el análisis de errores de experimentos. El importante método de mínimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el método desde 1794, lo justificó rigurosamente en 1809 asumiendo una distribución normal de los errores. El nombre de Gauss se ha asociado a esta distribución porque la usó con profusión cuando analizaba datos astronómicos[3] y algunos autores le atribuyen un descubrimiento independiente del de De Moivre.[4] Esta atribución del nombre de la distribución a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler.

El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie campana) por primera vez en 1872 para una distribución normal bivariante de componentes independientes. El nombre de "distribución normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta terminología, otras distribuciones de probabilidad podrían ser más apropiadas en determinados contextos; véase la discusión sobre ocurrencia, más abajo.

[editar] Definición formal

Hay varios modos de definir formalmente una distribución de probabilidad. La forma más visual es mediante su función de densidad. De forma equivalente, también pueden darse para su definición la función de distribución, los momentos, la función característica y la función generatriz de momentos, entre otros.

[editar] Función de densidad

Gráfica de la distribución normal de media 0 y desviación típica 1

Se dice que una variable aleatoria continua X sigue una distribución normal de parámetros μ y σ y se denota X~N(μ, σ) si su función de densidad está dada por:

f(x)=frac1{sigmasqrt{2pi}}; e^{ - frac{1}{2} left(frac{x-mu}{sigma}right)^2} , , quad xinmathbb{R},

donde μ (mu) es la media y σ (sigma) es la desviación típica (σ2 es la varianza).[5]

Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman los valores μ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente expresión:

f(x)=f_{0,1}(x)=frac{e^frac{-x^2}{2}}{sqrt{2pi,}}, ,quad xinmathbb{R},

Su gráfica se muestra a la derecha y con frecuencia se usan tablas para el cálculo de los valores de su distribución.

[editar] Función de distribución

Función de distribución para la distribución normal

La función de distribución de la distribución normal está definida como sigue:

 begin{align} Phi_{mu,sigma^2}(x) &{}=int_{-infty}^xvarphi_{mu,sigma^2}(u),du &{}=frac{1}{sigmasqrt{2pi}} int_{-infty}^x e^{-frac{(u - mu)^2}{2sigma^2}}, du ,quad xinmathbb{R} end{align}

Por tanto, la función de distribución de la normal estándar es:

 Phi(x) = Phi_{0,1}(x) = frac{1}{sqrt{2pi}} int_{-infty}^x e^{-frac{u^2}{2}} , du, quad xinmathbb{R}.

Esta función de distribución puede expresarse en términos de una función especial llamada función error de la siguiente forma:

 Phi(x) =frac{1}{2} Bigl[ 1 + operatorname{erf} Bigl( frac{x}{sqrt{2}} Bigr) Bigr], quad xinmathbb{R},

y la propia función de distribución puede, por consiguiente, expresarse así:

 Phi_{mu,sigma^2}(x) =frac{1}{2} Bigl[ 1 + operatorname{erf} Bigl( frac{x-mu}{sigmasqrt{2}} Bigr) Bigr], quad xinmathbb{R}.

El complemento de la función de distribución de la normal estándar, 1 − Φ(x), se denota con frecuencia Q(x), y es referida, a veces, como simplemente función Q, especialmente en textos de ingeniería.[6] [7] Esto representa la cola de probabilidad de la distribución gaussiana. También se usan ocasionalmente otras definiciones de la función Q, las cuales son todas ellas transformaciones simples de Φ.[8]

La inversa de la función de distribución de la normal estándar (función cuantil) puede expresarse en términos de la inversa de la función de error:

 Phi^{-1}(p) = sqrt2 ;operatorname{erf}^{-1} (2p - 1), quad pin(0,1),

y la inversa de la función de distribución puede, por consiguiente, expresarse como:

 Phi_{mu,sigma^2}^{-1}(p) = mu + sigmaPhi^{-1}(p) = mu + sigmasqrt2 ; operatorname{erf}^{-1}(2p - 1), quad pin(0,1).

Esta función cuantil se llama a veces la función probit. No hay una primitiva elemental para la función probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado la inexistencia de tal función. Existen varios métodos exactos para aproximar la función cuantil mediante la distribución normal (véase función cuantil).

Los valores Φ(x) pueden aproximarse con mucha precisión por distintos métodos, tales como integración numérica, series de Taylor, series asintóticas y fracciones continuas.

[editar] Límite inferior y superior estrictos para la función de distribución

Para grandes valores de x la función de distribución de la normal estándar scriptstylePhi(x) es muy próxima a 1 y scriptstylePhi(-x),{=},1,{-},Phi(x) está muy cerca de 0. Los límites elementales

 frac{x}{1+x^2}varphi(x)<1-Phi(x)<frac{varphi(x)}{x}, qquad x>0,

en terminos de la densidad scriptstylevarphi son útiles.

Usando el cambio de variable v = u²/2, el límite superior se obtiene como sigue:

 begin{align} 1-Phi(x) &=int_x^inftyvarphi(u),du &<int_x^inftyfrac uxvarphi(u),du =int_{x^2/2}^inftyfrac{e^{-v}}{xsqrt{2pi}},dv =-biggl.frac{e^{-v}}{xsqrt{2pi}}biggr|_{x^2/2}^infty =frac{varphi(x)}{x}. end{align}

De forma similar, usando scriptstylevarphi'(u),{=},-u,varphi(u) y la regla del cociente,

 begin{align} Bigl(1+frac1{x^2}Bigr)(1-Phi(x))&=Bigl(1+frac1{x^2}Bigr)int_x^inftyvarphi(u),du &=int_x^infty Bigl(1+frac1{x^2}Bigr)varphi(u),du &>int_x^infty Bigl(1+frac1{u^2}Bigr)varphi(u),du =-biggl.frac{varphi(u)}ubiggr|_x^infty =frac{varphi(x)}x. end{align}

Resolviendo para scriptstyle 1,{-},Phi(x), proporciona el límite inferior.

[editar] Funciones generadoras

[editar] Función generadora de momentos

La función generadora de momentos se define como la esperanza de e(tX). Para una distribución normal, la función generadora de momentos es:

 M_X(t) = mathrm{E} left[ e^{tX} right] = int_{-infty}^{infty}  frac{1}{sigma sqrt{2pi} } e^{-frac{(x - mu)^2}{2 sigma^2}} e^{tx} , dx = e^{mu t + frac{sigma^2 t^2}{2}}

como puede comprobarse completando el cuadrado en el exponente.

 

[editar] Función característica

La función característica se define como la esperanza de eitX, donde i es la unidad imaginaria. De este modo, la función característica se obtiene reemplazando t por it en la función generadora de momentos.

Para una distribución normal, la función característica es[9]

  begin{align} chi_X(t;mu,sigma) &{} = M_X(i t) = mathrm{E} left[ e^{i t X} right]  &{}= int_{-infty}^{infty} frac{1}{sigma sqrt{2pi}} e^{- frac{(x - mu)^2}{2sigma^2}} e^{i t x} , dx  &{}= e^{i mu t - frac{sigma^2 t^2}{2}} end{align}

[editar] Propiedades

Algunas propiedades de la distribución normal son:

  1. Es simétrica respecto de su media, μ;
    Distribución de probabilidad alrededor de la media en una distribución N(μ, σ).
  2. La moda y la mediana son ambas iguales a la media, μ;
  3. Los puntos de inflexión de la curva se dan para x = μ − σ y x = μ + σ.
  4. Distribución de probabilidad en un entorno de la media:
    1. en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el 68,26% de la distribución;
    2. en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la distribución;
    3. por su parte, en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida, aproximadamente, el 99,74% de la distribución. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prácticamente la totalidad de la distribución se encuentre a tres desviaciones típicas de la media justifica los límites de las tablas empleadas habitualmente en la normal estándar.
  5. Si X ~ N(μ, σ2) y a y b son números reales, entonces (aX + b) ~ N(+b, a2σ2).
  6. Si X ~ N(μx, σx2) e Y ~ N(μy, σy2) son variables aleatorias normales independientes, entonces:
    • Su suma está normalmente distribuida con U = X + Y ~ N(μx + μy, σx2 + σy2) (demostración). Recíprocamente, si dos variables aleatorias independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crámer).
    • Su diferencia está normalmente distribuida con V = X - Y sim N(mu_X - mu_Y, sigma^2_X + sigma^2_Y).
    • Si las varianzas de X e Y son iguales, entonces U y V son independientes entre sí.
    • La divergencia de Kullback-Leibler, D {rm KL}( X | Y ) = { 1 over 2 } left( log left( { sigma^2_Y over sigma^2_X } right) + frac{sigma^2_X}{sigma^2_Y} + frac{left(mu_Y - mu_Xright)^2}{sigma^2_Y} - 1right).
  7. Si X sim N(0, sigma^2_X) e Y sim N(0, sigma^2_Y) son variables aleatorias independientes normalmente distribuidas, entonces:
  8. Si X_1, dots, X_n son variables normales estándar independientes, entonces X_1^2 + cdots + X_n^2 sigue una distribución χ² con n grados de libertad.
  9. Si X_1,dots,X_n son variables normales estándar independientes, entonces la media muestral bar{X}=(X_1+cdots+X_n)/n y la varianza muestral S^2=((X_1-bar{X})^2+cdots+(X_n-bar{X})^2)/(n-1) son independientes. Esta propiedad caracteriza a las distribuciones normales y contribuye a explicar por qué el test-F no es robusto respecto a la no-normalidad).

[editar] Estandarización de variables aleatorias normales

Como consecuencia de la Propiedad 1; es posible relacionar todas las variables aleatorias normales con la distribución normal estándar.

Si X ~ N(μ,σ2), entonces

Z = frac{X - mu}{sigma} !

es una variable aleatoria normal estándar: Z ~ N(0,1).

La transformación de una distribución X ~ N(μ, σ) en una N(0, 1) se llama normalización, estandarización o tipificación de la variable X.

Una consecuencia importante de esto es que la función de distribución de una distribución normal es, por consiguiente,

Pr(X le x) = Phi left( frac{x-mu}{sigma} right) = frac{1}{2} left( 1 + operatorname{erf} left(   frac{x-mu}{sigmasqrt{2}} right) right) .

A la inversa, si Z es una distribución normal estándar, Z ~ N(0,1), entonces

X = σZ + μ

es una variable aleatoria normal tipificada de media μ y varianza σ2.

La distribución normal estándar está tabulada (habitualmente en la forma de el valor de la función de distribución Φ) y las otras distribuciones normales pueden obtenerse como transformaciones simples, como se describe más arriba, de la distribución estándar. De este modo se pueden usar los valores tabulados de la función de distribución normal estándar para encontrar valores de la función de distribución de cualquier otra distribución normal.

[editar] Momentos

Los primeros momentos de la distribución normal son:

NúmeroMomentoMomento centralCumulante
011 
1μ0μ
2μ2 + σ2σ2σ2
3μ3 + 3μσ200
4μ4 + 6μ2σ2 + 3σ440
5μ5 + 10μ3σ2 + 15μσ400
6μ6 + 15μ4σ2 + 45μ2σ4 + 15σ615σ60
7μ7 + 21μ5σ2 + 105μ3σ4 + 105μσ600
8μ8 + 28μ6σ2 + 210μ4σ4 + 420μ2σ6 + 105σ8105σ80

Todos los cumulantes de la distribución normal, más allá del segundo, son cero.


Los momentos centrales de orden superior (2k con μ = 0) vienen dados por la fórmula

 Eleft[X^{2k}right]=frac{(2k)!}{2^k k!} sigma^{2k}.

[editar] El Teorema del Límite Central

Artículo principal: Teorema del límite central
Gráfica de la función de distribución de una normal con μ = 12 y σ = 3, aproximando la función de distribución de una binomial con n = 48 y p = 1/4

El Teorema del límite central establece que bajo ciertas condiciones (como pueden ser independientes e idénticamente distribuidas con varianza finita), la suma de un gran número de variables aleatorias se distribuye aproximadamente como una normal.

La importancia práctica del Teorema del límite central es que la función de distribución de la normal puede usarse como aproximación de algunas otras funciones de distribución. Por ejemplo:

  • Una distribución binomial de parámetros n y p es aproximadamente normal para grandes valores de n, y p no demasiado cercano a 1 ó 0 (algunos libros recomiendan usar esta aproximación sólo si np y n(1 − p) son ambos, al menos, 5; en este caso se debería aplicar una corrección de continuidad).
    La normal aproximada tiene parámetros μ = np, σ2 = np(1 − p).
  • Una distribución de Poisson con parámetro λ es aproximadamente normal para grandes valores de λ.
    La distribución normal aproximada tiene parámetros μ = σ2 = λ.

La exactitud de estas aproximaciones depende del propósito para el que se necesiten y de la tasa de convergencia a la distribución normal. Se da el caso típico de que tales aproximaciones son menos precisas en las colas de la distribución. El Teorema de Berry-Esséen proporciona un límite superior general del error de aproximación de la función de distribución.

[editar] Divisibilidad infinita

Las normales tienen una distribución de probabilidad infinitamente divisible: dada una media μ, una varianza σ 2 ≥ 0, y un número natural n, la suma X1 + . . . + Xn de n variables aleatorias independientes

X_1+X_2+dots+X_n sim N(mu/n, sigma!/sqrt n),

tiene esta específica distribución normal (para verificarlo, úsese la función característica de convolución y la inducción matemática).

[editar] Estabilidad

Las distribuciones normales son estrictamente estables.

[editar] Desviación típica e intervalos de confianza

Alrededor del 68% de los valores de una distribución normal están a una distancia σ > 1 (desviación típica) de la media, μ; alrededor del 95% de los valores están a dos desviaciones típicas de la media y alrededor del 99,7% están a tres desviaciones típicas de la media. Esto se conoce como la "regla 68-95-99,7" o la "regla empírica".

Para ser más precisos, el área bajo la curva campana entre μ − nσ y μ + nσ en términos de la función de distribución normal viene dada por

begin{align}&Phi_{mu,sigma^2}(mu+nsigma)-Phi_{mu,sigma^2}(mu-nsigma) &=Phi(n)-Phi(-n)=2Phi(n)-1=mathrm{erf}bigl(n/sqrt{2},bigr),end{align}

donde erf es la función error. Con 12 decimales, los valores para los puntos 1-, 2-, hasta 6-σ son:

 n, mathrm{erf}bigl(n/sqrt{2},bigr),
1 0,682689492137 
20,954499736104
30,997300203937
40,999936657516
50,999999426697
60,999999998027

La siguiente tabla proporciona la relación inversa de múltiples σ correspondientes a unos pocos valores usados con frecuencia para el área bajo la campana de Gauss. Estos valores son útiles para determinar intervalos de confianza para los niveles especificados basados en una curva normalmente distribuida (o estimadores asintóticamente normales):

 mathrm{erf}bigl(n/sqrt{2},bigr) n, 
0,80 1,28155 
0,901,64485
0,951,95996
0,982,32635
0,992,57583
0,9952,80703
0,9983,09023
0,9993,29052
0,99993,8906
0,999994,4172

donde el valor a la izquierda de la tabla es la proporción de valores que caerán en el intervalo dado y n es un múltiplo de la desviación típica que determina la anchura de el intervalo.

[editar] Forma familia exponencial

La distribución normal tiene forma de familia exponencial biparamétrica con dos parámetros naturales, μ y 1/σ2, y estadísticos naturales X y X2. La forma canónica tiene como parámetros {mu over sigma^2} y {1 over sigma^2} y estadísticos suficientes sum  x y -{1 over 2} sum  x^2.

[editar] Distribución normal compleja

Considérese la variable aleatoria compleja gaussiana

 Z=X+iY,

donde X e Y son variables gaussianas reales e independientes con igual varianza sigma_r^2. La función de distribución de la variable conjunta es entonces

 frac{1}{2,pi,sigma_r^2} e^{-(x^2+y^2)/(2 sigma_r ^2)}.

Como sigma_Z =sqrt{2}sigma_r, la función de distribución resultante para la variable gaussiana compleja Z es

 frac{1}{pi,sigma_Z^2} e^{-|Z|^2!/sigma_Z^2}.

[editar] Distribuciones relacionadas

  • Y˜Cauchy(μ = 0,θ = 1) es una distribución de Cauchy si Y = X1 / X2 para X1˜N(0,1) y X2˜N(0,1) son dos distribuciones normales independientes.
  • Distribución normal truncada. si X sim N(mu, sigma^2),! entonces truncando X por debajo de A y por encima de B dará lugar a una variable aleatoria de media E(X)=mu + frac{sigma(varphi_1-varphi_2)}{T},! donde T=Phileft(frac{B-mu}{sigma}right)-Phileft(frac{A-mu}{sigma}right), ; varphi_1 = varphileft(frac{A-mu}{sigma}right), ; varphi_2 = varphileft(frac{B-mu}{sigma}right) y varphi es la función de densidad de una variable normal estándar.

[editar] Estadística descriptiva e inferencial

[editar] Resultados

De la distribución normal se derivan muchos resultados, incluyendo rangos de percentiles ("percentiles" o "cuantiles"), curvas normales equivalentes, stanines, z-scores, y T-scores. Además, un número de procedimientos de estadísticos de comportamiento están basados en la asunción de que esos resultados están normalmente distribuidos. Por ejemplo, el test de Student y el análisis de varianza (ANOVA) (véase más abajo). La gradación de la curva campana asigna grados relativos basados en una distribución normal de resultados.

[editar] Tests de normalidad

Artículo principal: Test de normalidad

Los tests de normalidad se aplican a conjuntos de datos para determinar su similitud con una distribución normal. La hipótesis nula es, en estos casos, si el conjunto de datos es similar a una distribución normal, por lo que un P-valor suficientemente pequeño indica datos no normales.

[editar] Estimación de parámetros

[editar] Estimación de parámetros de máxima verosimilitud

Supóngase que

X_1,dots,X_n

son independientes y cada una está normalmente distribuida con media μ y varianza σ 2 > 0. En términos estadísticos los valores observados de estas n variables aleatorias constituyen una "muestra de tamaño n de una población normalmente distribuida. Se desa estimar la media poblacional μ y la desviación típica poblacional σ, basándose en las valores observados de esta muestra. La función de densidad conjunta de estas n variables aleatorias independientes es

begin{align}f(x_1,dots,x_n;mu,sigma) &= prod_{i=1}^n varphi_{mu,sigma^2}(x_i) &=frac1{(sigmasqrt{2pi})^n}prod_{i=1}^n expbiggl(-{1 over 2} Bigl({x_i-mu over sigma}Bigr)^2biggr), quad(x_1,ldots,x_n)inmathbb{R}^n. end{align}

Como función de μ y σ, la función de verosimilitud basada en las observaciones X1, ..., Xn es

 L(mu,sigma) = frac C{sigma^n} expleft(-{sum_{i=1}^n (X_i-mu)^2 over 2sigma^2}right), quadmuinmathbb{R}, sigma>0,

con alguna constante C > 0 (de la cual, en general, se permitiría incluso que dependiera de X1, ..., Xn, aunque desapareciera con las derivadas parciales de la función de log-verosimilitud respecto a los parámetros tenidos en cuenta, véase más abajo).

En el método de máxima verosimilitud, los valores de μ y σ que maximizan la función de verosimilitud se toman como estimadores de los parámetros poblacionales μ y σ.

Habitualmente en la maximización de una función de dos variables, se podrían considerar derivadas parciales. Pero aquí se explota el hecho de que el valor de μ que maximiza la función de verosimilitud con σ fijo no depende de σ. No obstante, encontramos que ese valor de μ, entonces se sustituye por μ en la función de verosimilitud y finalmente encontramos el valor de σ que maximiza la expresión resultante.

Es evidente que la función de verosimilitud es una función decreciente de la suma

sum_{i=1}^n (X_i-mu)^2. ,!

Así que se desea el valor de μ que minimiza esta suma. Sea

overline{X}_n=(X_1+cdots+X_n)/n

la media muestral basada en las n observaciones. Nótese que

 begin{align} sum_{i=1}^n (X_i-mu)^2 &=sum_{i=1}^nbigl((X_i-overline{X}_n)+(overline{X}_n-mu)bigr)^2 &=sum_{i=1}^n(X_i-overline{X}_n)^2 + 2(overline{X}_n-mu)underbrace{sum_{i=1}^n (X_i-overline{X}_n)}_{=,0} + sum_{i=1}^n (overline{X}_n-mu)^2 &=sum_{i=1}^n(X_i-overline{X}_n)^2 + n(overline{X}_n-mu)^2. end{align}

Sólo el último término depende de μ y se minimiza por

widehat{mu}_n=overline{X}_n.

Esta es la estimación de máxima verosimilitud de μ basada en las n observaciones X1, ..., Xn. Cuando sustituimos esta estimación por μ en la función de verosimilitud, obtenemos

L(overline{X}_n,sigma) = frac C{sigma^n} expbiggl(-{sum_{i=1}^n (X_i-overline{X}_n)^2 over 2sigma^2}biggr), quadsigma>0.

Se conviene en denotar la "log-función de verosimilitud", esto es, el logaritmo de la función de verosimilitud, con una minúscula , y tenemos

ell(overline{X}_n,sigma)=log C-nlogsigma-{sum_{i=1}^n(X_i-overline{X}_n)^2 over 2sigma^2}, quadsigma>0,

entonces

 begin{align} {partial over partialsigma}ell(overline{X}_n,sigma) &=-{n over sigma} +{sum_{i=1}^n (X_i-overline{X}_n)^2 over sigma^3} &=-{n over sigma^3}biggl(sigma^2-{1 over n}sum_{i=1}^n (X_i-overline{X}_n)^2 biggr), quadsigma>0. end{align}

Esta derivada es positiva, cero o negativa según σ2 esté entre 0 y

hatsigma_n^2:={1 over n}sum_{i=1}^n(X_i-overline{X}_n)^2,

o sea igual a esa cantidad, o mayor que esa cantidad. (Si hay solamente una observación, lo que significa que n = 1, o si X1 = ... = Xn, lo cual sólo ocurre con probabilidad cero, entonces hatsigma{}_n^2=0 por esta fórmula, refleja el hecho de que en estos casos la función de verosimilitud es ilimitada cuando σ decrece hasta cero.)

Consecuentemente esta media de cuadrados de residuos es el estimador de máxima verosimilitud de σ2, y su raíz cuadrada es el estimador de máxima verosimilitud de σ basado en las n observaciones. Este estimador hatsigma{}_n^2 es sesgado, pero tiene un menor error medio al cuadrado que el habitual estimador insesgado, que es n/(n − 1) veces este estimador.

[editar] Sorprendente generalización

La derivada del estimador de máxima verosimilitud de la matriz de covarianza de una distribución normal multivariante es despreciable. Involucra el teorema espectral y la razón por la que puede ser mejor para ver un escalar como la traza de una matriz 1×1 matrix que como un mero escalar. Véase estimación de la covarianza de matrices.

[editar] Estimación insesgada de parámetros

El estimador de máxima verosimilitud de la media poblacional μ de una muestra es un estimador insesgado de la media. El estimador de máxima verosimilitud de la varianza es insesgado si asumimos que la población es conocida a priori, pero en la práctica esto no ocurre.No obstante, si nos enfrentamos con una muestra y no sabemos nada de la media o la varianza de la población de la que se ha extraído, como se asumía en la derivada de máxima verosimilitud de arriba, entonces el estimador de máxima verosimilitud de la varianza es sesgado. Un estimador insesgado de la varianza σ2 es:

 S^2 = frac{1}{n-1} sum_{i=1}^n (X_i - overline{X})^2.

Esta "varianza muestral" sigue una distribución Gamma si todas las Xi son independientes e idénticamente distribuidas:

 S^2 sim operatorname{Gamma}left(frac{n-1}{2},frac{2 sigma^2}{n-1}right),

con media operatorname{E}(S^2)=sigma^2 y varianza operatorname{Var}(S^2)=2sigma^4/(n-1).

La estimación de máxima verosimilitud de la desviación típica es la raíz cuadrada de la estimación de máxima verosimilitud de la varianza. No obstante, ni esta, ni la raíz cuadrada de la varianza muestral proporcionan un estimador insesgado para la desviación típica (véase estimación insesgada de la desviación típica para una fórmula particular para la distribución normal.

[editar] Incidencia

Las distribuciones aproximadamente normales aparecen por doquier, como queda explicado por el teorema central del límite. Cuando en un fenómeno se sospecha la presencia de un gran número de pequeñas causas actuando de forma aditiva e independiente es razonable pensar que las observaciones serán "normales". Hay métodos estadísticos para probar empíricamente esta asunción, por ejemplo, el test de Kolmogorov-Smirnov.

Hay causas que pueden actuar de forma multiplicativa (más que aditiva). En este caso, la asunción de normalidad no está justificada y es el logaritmo de la variable en cuestión el que estaría normalmente distribuido. La distribución de las variables directamente observadas en este caso se denomina log-normal.

Finalmente, si hay una simple influencia externa que tiene un gran efecto en la variable en consideración, la asunción de normalidad no está tampoco justificada. Esto es cierto incluso si, cuando la variable externa se mantiene constante, las distribuciones marginales resultantes son, en efecto, normales. La distribución completa será una superposición de variables normales, que no es en general normal. Ello está relacionado con la teoría de errores (véase más abajo).

A continuación se muestran una lista de situaciones que estarían, aproximadamente, normalmente distribuidas. Más abajo puede encontrarse una discusión detallada de cada una de ellas:

  • En problemas de recuento, donde el teorema central del límite incluye una aproximación de discreta a continua y donde las distribuciones infinitamente divisibles y descomponibles están involucradas, tales como:
  • En medidas fisiológicas de especímenes biológicos:
    • El logaritmo de las medidas del tamaño de tejidos vivos (longitud, altura, superficie de piel, peso);
    • La longitud de apéndices inertes (pelo, garras, rabos, dientes) de especímenes biológicos en la dirección del crecimento;
    • Otras medidas fisiológicas podrían estar normalmente distribuidas, aunque no hay razón para esperarlo a priori;
  • Se asume con frecuencia que los errores de medida están normalmente distribuidos y cualquier desviación de la normalidad se considera una cuestión que debería explicarse;
  • Variables financieras, en el modelo Black-Scholes:
    • Cambios en el logaritmo de

Changes in the logarithm of tasas de cambio, índices de precios, índices de existencias de mercado; estas variables se comportan como el interés compuesto, no como el interés simple, por tanto, son multiplicativas;

    • Mientras que el modelo Black-Scholes presupone normalidad, en realidad estas variables exhiben colas pesadas, como puede verse en crash de las existencias de mercado;
    • Otras variables financieras podrían estar normalmente distribuidas, pero no hay razón para esperarlo a priori;
  • Intensidad de la luz:
    • La intensidad de la luz láser está normalmente distribuida;
    • La luz térmica tiene una distribución de Bose-Einstein en escalas de tiempo muy breves y una distribución normal en grandes escalas de tiempo debido al teorema central del límite.

Es relevante para la biolgía y la economía el hecho de que los sistemas complejos tienden a mostrar power laws más que normal.

[editar] Recuento de fotones

La intensidad de la luz de una sola fuente varía con el tiempo, así como las fluctuaciones térmicas que pueden observarse si la luz se analiza a una resolución suficientemente alta. La mecánica cuántica interpreta las medidas de la intensidad de la luz como un recuento de fotones, donde la asunción natural es usar la distribución de Poisson. Cuando la intensidad de la luz se integra a lo largo de grandes periodos de tiempo mayores que el tiempo de coherencia, la aproximación Poisson - Normal es apropiada.

[editar] Medida de errores

La normalidad es la asunción central de la teoría matemática de errores. De forma similar en el ajuste de modelos estadístico, un indicador de la bondad del ajuste es que el error residual (así es como se llaman los errores en esta circunstancia) sea independiente y normalmente distribuido. La asunción es que cualquier desviación de la normalidad necesita ser explicada. En ese sentido, en ambos, ajuste de modelos y teoría de errores, la normalidad es la única observación que no necesita ser explicada, sino que es esperada. No obstante, si los datos originales no están normalmente distribuidos (por ejemplo, si siguen una distribución de Cauchy, entonces los residuos tampoco estarán normalmente distribuidos. Este hecho es ignorado habitualmente en la práctica.

Las medidas repetidas de la misma cantidad se espera que cedan el paso a resultados que están agrupados entorno a un valor particular. Si todas las fuentes principales de errores se han tomado en cuenta, se asume que el error que queda debe ser el resultado de un gran número de muy pequeños y aditivos efectos y, por consiguiente, normal. Las desviaciones de la normalidad se interpretan como indicaciones de errores sistemáticos que no han sido tomados en cuenta. Puede debatirse si esta asunción es válida.

Una famosa observación atribuida a Gabriel Lippmann dice:[cita requerida]

Todo el mundo cree en la ley normal de los errores: los matemáticos, porque piensan que es un hecho experimental; y los experimentadores, porque suponen que es un teorema matemático

Otra fuente podría ser Henri Poincaré.

[editar] Características físicas de especímenes biológicos

Los tamaños de los animales adultos siguen aproximadamente una distribución lognormal. La evidencia y explicación basada en modelos de crecimiento fue publicada por primera vez en el libro Problemas de crecimiento relativo, de 1932, por Julian Huxley.

Las diferencias de tamaño debido a dimorfismos sexuales u otros polimorfismos de insectos, como la división social de las abejas en obreras, zánganos y reinas, por ejemplo, hace que la distribución de tamaños se desvíe hacia la lognormalidad.

La asunción de que el tamaño lineal de los especímenes biológicos es normal (más que lognormal) nos lleva a una distribución no normal del peso (puesto que el peso o el volumen es proporcional al cuadrado o el cubo de la longitud y las distribuciones gaussianas sólo mantienen las transformaciones lineales). A la inversa, asumir que el peso sigue una distribución normal implica longitudes no normales. Esto es un problema porque, a priori, no hay razón por la que cualquiera de ellas (longitud, masa corporal u otras) debería estar normalmente distribuida. Las distribuciones lognormales, por otro lado, se mantienen entre potencias, así que el "problema" se desvanece si se asume la lognormalidad.

Por otra parte, hay algunas medidas biológicas donde se asume normalidad, tales como la presión sanguínea en humanos adultos. Esta asunción sólo es posible tras separar a hombres y mujeres en distintas poblaciones, cada una de las cuales está normalmente distribuida.

[editar] Variables financieras

El modelo normal de movimiento de activos no incluye movimientos extremos tales como quiebras financieras.

Ya en 1900 Louis Bachelier propuso representar los precios de cambio usando la distribución normal. Esta aproximación se ha modificado desde entonces ligeramente. A causa de la naturaleza multiplicativa del interés compuesto, los indicadores financieros como valores de mercado y precios de las materias primas exhiben un "comportamiento multiplicativo". Como tales, sus cambios periódicos (por ejemplo, cambios anuales) no son normales, sino lognormales. Esta es todavía la hipótesis más comúnmente aceptada en economía.

No obstante, en realidad las variables financieras exhiben colas pesadas y así, la asunción de normalidad infravalora la probabilidad de eventos extremos como quiebras financieras. Se han sugerido correcciones a este modelo por parte de matemáticos como Benoît Mandelbrot, quien observó que los cambios en el logaritmo durante breves periodos de tiempo (como un día) se aproximan bien por distribuciones que no tienen una varianza finita y, por consiguiente, el teorema central del límite no puede aplicarse. Más aún, la suma de muchos de tales cambios sigue una distribución de log-Levy.

[editar] Distribuciones en tests de inteligencia

A veces, la dificultad y número de preguntas en un test de inteligencia se selecciona de modo que proporcionen resultados normalmente distribuidos. Más aún, las puntuaciones "en crudo" se convierten a valores que marcan el cociente intelectual ajustándolas a la distribución normal. En cualquier caso se trata de un resultado causado deliberadamente por la construcción del test o de una interpretación de las puntuaciones que sugiere normalidad para la mayoría de la población. Sin embargo, la cuestión acerca de si la inteligencia en sí está normalmente distribuida es más complicada porque se trata de una variable latente y, por consiguiente, no puede observarse directamente.

[editar] Ecuación de difusión

La función de densidad de la distribución normal está estrechamente relacionada con la ecuación de difusión (homogénea e isótropa) y, por tanto, también con la ecuación de calor. Esta ecuación diferencial parcial describe el tiempo de evolución de una función de densidad bajo difusión. En particular, la función de densidad de masa

varphi_{0,t}(x) = frac{1}{sqrt{2pi t,}}expleft(-frac{x^2}{2t}right),

para la distribución normal con esperanza 0 y varianza t satisface la ecuación de difusión:

 frac{partial}{partial t} varphi_{0,t}(x) = frac{1}{2} frac{partial^2}{partial x^2} varphi_{0,t}(x).

Si la densidad de masa para un tiempo t = 0 viene dada por la delta de Dirac, lo cual significa, esencialemente que toda la masa está inicialmente concentrada en un punto, entonces la función de densidad de masa en el tiempo t tendrá la forma de la función de densidad de la normal, con varianza creciendo linealmente con t. Esta conexión no es coincidencia: la difusión se debe a un movimiento Browniano que queda descrito matemáticamente por un proceso de Wiener, y tal proceso en un tiempo t también resultará normal con varianza creciendo linealmente con t'.

Más generalmente, si la densidad de masa inicial viene dada por una función φ(x), entonces la densidad de masa en un tiempo t vendrá dada por la convolución de φ y una función de densidad normal.

[editar] Uso en estadística computacional

[editar] Generación de valores para una variable aleatoria normal

Para simulaciones por ordenador es útil, en ocasiones, generar valores que podrían seguir una distribución normal. Hay varios métodos y el más básico de ellos es invertir la función de distribución de la normal estándar. Se conocen otros métodos más eficientes, uno de los cuales es la transformacion de Box-Muller. Un algoritmo incluso más rápido es el algoritmo zigurat. Ambos se discuten más abajo. Una aproximación simple a estos métodos es programarlos como sigue: simplemente súmense 12 desviaciones uniformes (0,1) y réstense 6 (la mitad de 12). Esto es bastante útil en muchas aplicaciones. La suma de esos 12 valores sigue la distribución de Irwin-Hall; son elegidos 12 para dar a la suma una varianza de uno, exactamente. Las desviaciones aleatorias resultantes están limitadas al rango (−6, 6) y tienen una densidad que es una doceava sección de una aproximación polinomial de undécimo orden a la distribución normal .[10]

El método de Box-Muller dice que, si tienes dos números aleatorios U y V uniformemente distribuidos en (0, 1], (por ejemplo, la salida de un generador de números aleatorios), entonces X e Y son dos variables aleatorias estándar normalmente distribuidas, donde:

Y = sqrt{- 2 ln U} , sin(2 pi V) .

Esta formulación aparece porque la distribución χ² con dos grados de libertad (véase la propiedad 4, más arriba) es una variable aleatoria exponencial fácilmente generada (la cual corresponde a la cantidad lnU en estas ecuaciones). Así, un ángulo elegido uniformemente alrededor de un círculo vía la variable aleatoria V y un radio elegido para ser exponencial se transforman entonces en coordenadas x e y normalmente distribuidas.

Un método mucho más rápido que la transformación de Box-Muller, pero que sigue siendo exacto es el llamado algoritmo Zigurat, desarrollado por George Marsaglia. En alrededor del 97% de los casos usa sólo dos números aleatorios, un entero aleatorio y un uniforme aleatorio, una multiplicación y un test-si . Sólo un 3% de los casos donde la combinación de estos dos cae fuera del "corazón del zigurat", un tipo de rechazo muestral usando logaritmos, exponenciales y números aleatorios más uniformes deberían ser empleados.

Hay también alguna investigación sobre la conexión entre la rápida transformación de Hadamard y la distribución normal, en virtud de que la transformación emplea sólo adición y sustracción y por el teorema central del límite los números aleatorios de casi cualquier distribución serán transformados en la distribución normal. En esta visión se pueden combinar una serie de transformaciones de Hadamard con permutaciones aleatorias para devolver conjuntos de datos aleatorios normalmente distribuidos.

[editar] Aproximaciones numéricas de la distribución normal y su función de distribución

La función de distribución normal se usa extensamente en computación científica y estadística. Por consiguiente, ha sido implementada de varias formas.

La Biblioteca Científica GNU calcula valores de la función de distribución normal estándar usando aproximaciones por funciones racionales a trozos. Otro método de aproximación usa polinomios de tercer grado en intervalos.[11] El artículo sobre el lenguaje de programación bc proporciona un ejemplo de cómo computar la función de distribución en GNU bc.

Para una discusión más detallada sobre cómo calcular la distribución normal, véase la sección 3.4.1C. de The Art of Computer Programming (El arte de la programación por ordenador), de Knuth.

[editar] Uso de tablas

La probabilidad de que una variable aleatoria (que sigue una distribución normal) se encuentre entre dos valores determinados será en general difícil de calcular (hay que usar la integral de la función de probabilidad). Para ello, existen tablas con los valores correspondientes, si bien éstos se calculan para la distribución Normal Tipificada.

Básicamente, se busca un valor de x (por ejemplo, x=0,37 ,!), y la tabla nos da la probabilidad de que Zle x ,!: P(Z_{(0,1)} le 0,37)= 0,644 308 699 ,!

En el caso de que la distribución no sea estándar, por ejemplo, N(mu ,sigma^2) ,! con mu =2 ,! y sigma^2 =9 ,!, tendremos que tipificar la variable: P(X_{(2,3)} le 2,6)= Pleft (frac{X_{(2,3)} -mu }{sigma}le frac{2,6-mu}{sigma} right)=P left(Z_{(0,1)} le frac{2,6-2}{3}right)=P left(Z_{(0,1)} le 0,2 right) ,! Se obtiene una variable Z normal, que además está tipificada. Si ahora se consulta en la tabla, P(X_{(2,3)} le 2,6) = P(Z_{(0,1)} le 0,2) = 0,579 259 687  ,!

[editar] Véase también

[editar] Referencias

  1. Es una consecuencia del Teorema Central del Límite
  2. Abraham de Moivre, "Approximatio ad Summam Terminorum Binomii (a + b)n in Seriem expansi" (impreso el 12 de noviembre de 1733 en Londres para una edición privada). Este panfleto se reimprimió en: (1) Richard C. Archibald (1926) “A rare pamphlet of Moivre and some of his discoveries,” Isis, vol. 8, páginas 671-683; (2) Helen M. Walker, “De Moivre on the law of normal probability” en David Eugene Smith, A Source Book in Mathematics [Nueva York, Nueva York: McGraw-Hill, 1929; reimpresión: Nueva York, Nueva York: Dover, 1959], vol. 2, páginas 566-575.; (3) Abraham De Moivre, The Doctrine of Chances (2ª ed.) [Londres: H. Woodfall, 1738; reimpresión: Londres: Cass, 1967], páginas 235-243; (3ª ed.) [Londres: A Millar, 1756; reimpresión: Nueva York, Nueva York: Chelsea, 1967], páginas 243-254; (4) Florence N. David, Games, Gods and Gambling: A History of Probability and Statistical Ideas [Londres: Griffin, 1962], Apéndice 5, páginas 254-267.
  3. Havil, 2003
  4. Wussing, Hans. «Lección 10». Lecciones de Historia de las Matemáticas (1ª (castellano) edición). Siglo XXI de España Editores, S.A.. pp. 190. ISBN 84-323-0966-4. http://books.google.es/books?id=IG3_b5Xm8PMC. «"La distribución normal y sus aplicaciones a la teoría de errores se asocia a menudo con el nombre de Gauss, quien la descubrió -igual que Laplace- independientemente; no obstante ya había sido estudiada por de Moivre» 
  5. Weisstein, Eric W. «Normal Distribution» (en inglés). MathWorld. Wolfram Research. Consultado el 18 de marzo de 2009.
  6. La función Q
  7. http://www.eng.tau.ac.il/~jo/academic/Q.pdf
  8. Weisstein, Eric W. «Normal Distribution Function» (en inglés). MathWorld. Wolfram Research.
  9. M.A. Sanders. «Characteristic function of the univariate normal distribution». Consultado el 06-03-2009.
  10. Johnson NL, Kotz S, Balakrishnan N. (1995) Continuous Univariate Distributions Volume 2, Wiley. Equation(26.48)
  11. Andy Salter. «B-Spline curves». Consultado el 05-12-2008.

[editar] Enlaces externos

22/09/2010 20:54 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿HA PENSADO SI LOS NÚMEROS SON SIMÉTRICOS, OPUESTOS...?. ¿HA PENSADO EN LA INTELIGENCIA Y LA FRONTALIDAD?. La simetría es la exacta correspondencia de todas las partes de una figura respecto de un centro, un eje o un plano. La simetría es un rasgo característico de formas geométricas, sistemas, ecuaciones, y otros objetos materiales o entidades abstractas, relacionada con su invariancia bajo ciertas transformaciones, movimientos o intercambios. En condiciones formales, decimos que un objeto es simétrico en lo que concierne a una operación matemática dada, si, cuando aplicado al objeto, esta operación no cambia el objeto o su aspecto. Dos objetos son simétricos uno al otro en lo que concierne a un grupo dado de operaciones si uno es obtenido de otro por algunas operaciones (y viceversa). En la geometría 2D las clases principales de simetría de interés son las que conciernen a las isometrías de un espacio euclídeo: traslaciones, rotaciones, reflexiones y reflexiones que se deslizan.

Simetría

De Wikipedia, la enciclopedia libre
El hombre Vitrubio, de Leonardo da Vinci (ca. 1487), es una representación frecuente de la simetría del cuerpo humano, y por extensión del mundo natural.

La simetría es la exacta correspondencia de todas las partes de una figura respecto de un centro, un eje o un plano.

La simetría es un rasgo característico de formas geométricas, sistemas, ecuaciones, y otros objetos materiales o entidades abstractas, relacionada con su invariancia bajo ciertas transformaciones, movimientos o intercambios.

En condiciones formales, decimos que un objeto es simétrico en lo que concierne a una operación matemática dada, si, cuando aplicado al objeto, esta operación no cambia el objeto o su aspecto. Dos objetos son simétricos uno al otro en lo que concierne a un grupo dado de operaciones si uno es obtenido de otro por algunas operaciones (y viceversa). En la geometría 2D las clases principales de simetría de interés son las que conciernen a las isometrías de un espacio euclídeo: traslaciones, rotaciones, reflexiones y reflexiones que se deslizan.

La simetría también puede ser encontrado en organismos vivos.

Contenido

[ocultar]

[editar] Simetría en geometría

Grupo de simetría de la esfera.

Cuando hablamos de objetos físicos o elementos geométricos el concepto de simetría está asociado a transformaciones geométricas tales como las rotaciones, las reflexiones o las traslaciones. Así se dice que un objeto presenta:

  • Simetría esférica si existe simetría bajo cualquier rotación posible, matemáticamente equivale a que el grupo de simetría de un objeto físico o entidad matemática sea SO(3).
  • Simetría cilíndrica o axial, si existe un eje tal que los giros alrededor de él no conducen a cambios de posición en el espacio, matemáticamente está asociado a un grupo de isometría SO(2).
  • Simetría reflectiva,se define por la existencia de un único plano, matemáticamente está asociado al grupo SO(1) o su representación equivalente mathbb{Z}_2.

Si tratamos además de regiones geométricas infinitas, no acotadas, además puede existir simetría traslacional

[editar] Simetría en física

En física el concepto de simetría puede formularse en una forma no geométrica. Si K es un conjunto de objetos matemáticos del mismo tipo (funciones, formas geométricas, ecuaciones, ...) y G es un grupo de transformaciones que actúa sobre K de tal manera que:

g (in G): K to K

Se dice que un elemento de k0 presenta simetría si:[1]

forall gin G: g(k_0) = k_0

Así por ejemplo varias leyes de conservación de la física son consecuencia de la existencia de simetrías abstractas del lagrangiano, tal como muestra el teorema de Noether. En ese caso K representaría el conjunto de lagrangianos admisibles, k0 el lagrangian[2]

  • Ejemplo 1. Como primer ejemplo consideremos un electrón moviéndose entre dos placas infinitas cargadas uniformemente (dicho sistema se aproxima cierto tipo de condensadores), dado que cualquier tralación paralela a los planos constituye una simetría del sistema físico, entonces tanto la fuerza paralela a dichos planos es nula y por tanto la velocidad paralela a los planos es constante.
  • Ejemplo 2. Consideremos un satélite orbitando alredodor de un astro (planeta o estrella) con simetría esférica perfecta, consideremos además que la velocidad del satelite sea perpendicular a la línea entre el centro del satélite y el astro. En ese caso, el lagrangiano es totalmente invariante respecte a rotaciones según un eje que pase por el centro de la fuente del campo gravitatorio. En este caso debido a la simetría de rotación tanto del lagrangiano como de las condiciones iniciales del movimiento, la velocidad perpendicular al planeta es constante y la trayectoria es un círculo invariante bajo una rotación perpendicular al plano de la órbita.

Estos dos ejemplos anteriores son casos del teorema de Noether, un resultado general que establece que si existe un grupo uniparamétrico de simetría G para el lagrangiano tal que:

forall phi_lambdain G: L(phi_lambda(mathbf{q}),phi_lambda(dotmathbf{q}),t) =  L(mathbf{q},dotmathbf{q},t)

Entonces la cantidad escalar:

left langle left . frac{dphi_lambda}{dlambda}right vert_{lambda=0}, frac{dL}{ddotmathbf{q}}rightrangle = v_1p_1 + ... + v_Np_N

Siendo v el campo vectorial que general el grupo uniparamétrico de transformaciones de simetría, y pi los momentos conjungados de las coordenadas generalizadas de posición.

[editar] Simetría en química

Artículo principal: Simetría molecular

En química la simetría geométrica de las moléculas es importante, particularmente en química orgánica. Además propiedades como su momento dipolar y las transiciones espectroscópicas permitidas (basadas en reglas de selección como la regla de Laporte) pueden predecirse o ser explicadas a partir de la simetría de la molécula. Las simetrías que aparecen en química están asociadas a grupos finitos de isometrías, en concreto son grupos puntuales de transformaciones de isometría.

[editar] Simetría en biología

Ilustración de los distintos tipos de simetría en las formas orgánicas (Field Museum, Chicago).

Simetría en biología es la equilibrada distribución en el cuerpo de los organismos de aquellas partes que aparecen duplicadas. Los planes corporales de la mayoría de organismos pluricelulares exhiben alguna forma de simetría, bien sea simetría radial o simetría bilateral. Una pequeña minoría no presenta ningún tipo de simetría (son asimétricos).

[editar] Simetría radial

Artículo principal: Simetría radial (biología)

La simetría radial es la simetría definida por un eje heteropolar (distinto en sus dos extremos). El extremo que contiene la boca se llama lado oral, y su opuesto lado aboral o abactinal. Sobre este eje, se establecen planos principales de simetría; dos perpendiculares que definen las posiciones per-radiales. Las estructuras en otros planos (bisectrices de los per-radiales) quedan en posiciones inter-radiales. La zona entre los per-radiales y los inter-radiales es la zona ad-radial.

[editar] Simetría bilateral

Artículo principal: Simetría bilateral

La mayoría de especies animales tiene simetría bilateral y pertenece por tanto al grupo Bilateria, aunque hay especies como los erizos y las estrellas de mar que presentan simetría radial secundaria (las fases de desarrollo tempranas y las larvas poseen simetría bilateral que posteriormente se pierde en el adulto). La simetría bilateral permite la definición de un eje corporal en la dirección del movimiento, lo que favorece la formación de un sistema nervioso centralizado y la cefalización.

[editar] Simetría en música

En música clásica, existen composiciones en las que podemos encontrar distribuciones de las notas generadas mediante simetría bilateral, traslación o giros de media vuelta. Algunos ejemplos de autores y composiciones conocidas, son: Bach Preludio, Domenico Scarlatti Sonata en G mayor, Robert Schumann Lotosblume, o Richard Wagner Die Meiestersinger.

[editar] Simetría en alimentación de AC

En el contexto de la electrónica de radiofrecuencia, se habla de una alimentación simétrica de AC cuando ninguno de los conductores está a la masa. Cuando uno de los conductores está a la masa y el otro experimenta las variaciones de tensión, se dice que la alimentación es asimétrica.

Existen importantes aplicaciones tecnológicas basadas en la alimentación simétrica, ya que la alimentación simétrica tiene la gran ventaja de que la pérdida de potencia en la línea de transmisión es un orden de magnitud menor que la alimentación asimétrica por cable coaxial.

  • En efecto, el campo alterno generado por el conductor ascendente es cancelado por el campo generado por su homólogo descendente.
  • Además, la alimentación simétrica en delta permite la simplificación de la construcción.

La alimentación simétrica es por lo tanto la alimentación preferida en la operación QRP y en el modo EME, modos donde cada dB de ganancia cuenta.

[editar] Referencias

  1. Wald, 1984, p. 441-444.
  2. jkj

[editar] Bibliografía

[editar] Enlaces

22/09/2010 20:07 petalofucsia #. Matemáticas Hay 3 comentarios.

MATEMÁTICAS: SISTEMAS. Un sistema (del latín systema, proveniente del griego σύστημα) es un conjunto de funciones, virtualmente referenciada sobre ejes, bien sean estos reales o abstractos. También suele definirse como un conjunto de elementos dinámicamente relacionados formando una actividad para alcanzar un objetivo operando sobre datos, energía o materia para proveer información.

Sistema

De Wikipedia, la enciclopedia libre
Para otros usos de este término, véase Sistema (desambiguación).

Un sistema (del latín systema, proveniente del griego σύστημα) es un conjunto de funciones, virtualmente referenciada sobre ejes, bien sean estos reales o abstractos. También suele definirse como un conjunto de elementos dinámicamente relacionados formando una actividad para alcanzar un objetivo operando sobre datos, energía o materia para proveer información.

Un sistema es un conjunto de partes o elementos organizadas y relacionadas, que interactúan entre en si, para llegar a un mismo objetivo. Los sistemas reciben (entrada) datos, energía o materia del ambiente y tienen como resultado que proveen (salida) información, energía o materia.

Los sistemas tienen límites o fronteras, que los diferencian del ambiente. Ese limite puede ser físico (el gabinete de una computadora) o conceptual. Si hay algún intercambio entre el sistema y el ambiente a través de ese límite, el sistema es abierto, de lo contrario el sistema seria cerrado. El ambiente es el medio externo que envuelve física o conceptualmente a un sistema. El ambiente también puede ser una amenaza para el sistema.

Contenido

[ocultar]

[editar] Sistemas reales y sistemas conceptuales

Un sistema conceptual o sistema ideal es un conjunto organizado de definiciones, nombres, símbolos y otros instrumentos de pensamiento o comunicación. Ejemplos de sistemas conceptuales son las matemáticas, la lógica formal, la nomenclatura binomial o la notación musical.

Un sistema es un conjunto de elementos relacionados intimamente entre sí para alcanzar un objetivo.

Un sistema real es una entidad material formada por partes organizadas (o sus "componentes") que interactúan entre sí de manera que las propiedades del conjunto, sin contradecirlas, no pueden deducirse por completo de las propiedades de las partes. Tales propiedades se denominan propiedades emergentes.

Los sistemas reales intercambian con su entorno energía, información y, en la mayor parte de los casos, también materia. Una célula, un ser vivo, la Biosfera o la Tierra entera son ejemplos de sistemas naturales. El concepto se aplica también a sistemas humanos o sociales, como una sociedad entera, la administración de un estado, un ejército o una empresa. O a una lengua, que es un sistema conceptual complejo en cuya aparición y evolución participan la biología y la cultura.


Encontrar lo común a entidades muy diferentes. El esfuerzo por encontrar leyes generales del comportamiento de los sistemas reales es el que funda la Teoría de sistemas y, más en general, aquella tendencia de la investigación a la que se alude como pensamiento sistémico o Sistémica, en cuyo marco se encuentran disciplinas y teorías como la Cibernética, la Teoría de la información, la Teoría de juegos, la Teoría del caos y otras.

[editar] Tipos de sistemas

En cuanto a su constitución, pueden ser físicos o abstractos:

  • Sistemas físicos o concretos: compuestos por equipos, maquinaria, objetos y cosas reales. El hardware.
  • Sistemas abstractos: compuestos por conceptos, planes, hipótesis e ideas. Muchas veces solo existen en el pensamiento de las personas. Es el software.

En cuanto a su naturaleza, pueden cerrados o abiertos:

  • Sistemas cerrados: no presentan intercambio con el medio ambiente que los rodea, son herméticos a cualquier influencia ambiental. No reciben ningún recurso externo y nada produce que sea enviado hacia fuera. En rigor, no existen sistemas cerrados. Se da el nombre de sistema cerrado a aquellos sistemas cuyo comportamiento es determinista y programado y que opera con muy pequeño intercambio de energía y materia con el ambiente. Se aplica el término a los sistemas completamente estructurados, donde los elementos y relaciones se combinan de una manera peculiar y rígida produciendo una salida invariable, como las máquinas.
  • Sistemas abiertos: presentan intercambio con el ambiente, a través de entradas y salidas. Intercambian energía y materia con el ambiente. Son adaptativos para sobrevivir. Su estructura es óptima cuando el conjunto de elementos del sistema se organiza, aproximándose a una operación adaptativa. La adaptabilidad es un continuo proceso de aprendizaje y de auto-organización.
  • Sistemas aislados: son aquellos sistemas en los que no se produce intercambio de materia ni energìa.

Los sistemas abiertos no pueden vivir aislados. Los sistemas cerrados, cumplen con el segundo principio de la termodinámica que dice que "una cierta cantidad llamada entropía, tiende a aumentar al máximo".

Existe una tendencia general de los eventos en la naturaleza física en dirección a un estado de máximo desorden. Los sistemas abiertos evitan el aumento de la entropía y pueden desarrollarse en dirección a un estado de creciente orden y organización (entropía negativa). Los sistemas abiertos restauran sus propia energía y reparan pérdidas en su propia organización. El concepto de sistema abierto se puede aplicar a diversos niveles de enfoque: al nivel del individuo, del grupo, de la organización y de la sociedad.

[editar] Tipos de sistemas reales y orgánicos

Los sistemas reales pueden ser abiertos, cerrados o aislados, según que realicen o no intercambios con su entorno. Un sistema abierto es un sistema que recibe flujos (energía y materia) de su ambiente, cambiando o ajustando su comportamiento o su estado según las entradas que recibe. Los sistemas abiertos, por el hecho de recibir energía, pueden realizar el trabajo de mantener sus propias estructuras e incluso incrementar su contenido de información (mejorar su organización interna).

  • Un sistema abierto puede compartir materia o energía con su medio ambiente.
  • Un sistema cerrado no puede compartir materia, pero si puede compartir energía con su medio ambiente.
  • Un sistema aislado no puede compartir ni energía ni materia con su medio ambiente.

Una pared sirve para aislar un sistema con su medio ambiente, una pared puede ser rígida o móvil, impermeable o no impermeable y adiabática o no adiabática, dependiendo si conduce o no calor, conductora o no conductora de energía eléctrica e incluso puede ser aislante de frecuencias de audio.

Un sistema cerrado no necesariamente tiene que ser aislado, en cambio un sistema aislado si que tiene que ser cerrado.

Un sistema rodeado por una pared rígida, impermeable, adiabática, no conductora y aislante de frecuencias de audio es un sistema aislado.

Cuando un sistema tiene la organización necesaria para controlar su propio desarrollo, asegurando la continuidad de su composición y estructura (homeostasis) y la del conjunto de flujos y transformaciones con que funciona (homeorresis), mientras las perturbaciones producidas desde su entorno no superen cierto grado, se denomina sistema autopoyético.

La expresión sistemas cibernéticos se les aplica a éstos por su capacidad de control autónomo, dependiente de la existencia de mecanismos de retroalimentación negativa. Los mismos son llamados sistemas disipativos porque la conservación del orden (información) en su seno, y más su ampliación, requieren la disipación permanente de energía.

Los sistemas complejos, cibernéticos, autoorganizados y disipativos son a la vez sistemas teleológicos (sistemas adaptativos), que requieren para ser descritos un lenguaje finalístico, que se refiere a sus procesos como funciones y recurre constantemente a explicaciones que empiezan por «para».

[editar] Otras aplicaciones del término

[editar] En el arte

Se considera que el arte es un sistema porque es un conjunto de elementos que se relacionan entre sí. El sistema del arte esta compuesto por un conjunto de elementos que se denominan arte. Esos elementos son por ejemplo: la cultura, las pinturas, o formas de expresión realizadas por el hombre. Este sistema se puede considerar un sistema abierto porque recibe influencia y a su vez influye en otros sistemas por estar dentro de otro sistema más grande. Recibe influencia del mundo científico, de los sistemas económicos, religiones, etc.

[editar] En matemáticas

El cálculo entre distintos sistemas a diferentes jerarquías se realiza mediante el cálculo de transformación. Cada sistema tiene un conjunto de ejes, a su vez cada eje puede ser la referencia a la actividad de otro sistema. Para reubicar los valores de los sistemas a diferentes jerarquías sobre un eje de referencias, se usan transformadas destinadas a tratar las referencias conforme al espacio o área de referencia final. Así pueden haber transformadas directas e inversas. No puede existir transformación si previamente no ha habido una integración.

[editar] Véase también

22/09/2010 20:03 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: SI NO SEGUIMOS ESTE ORDEN: GRUPO, PAREJA, FAMILIA, ¿HAY ORDEN EN EL SISTEMA? Uno de los significados de orden es la propiedad que emerge en el momento en que varios sistemas abiertos, pero en origen aislados, llegan a interactuar por coincidencia en el espacio y el tiempo, produciendo, mediante sus interacciones naturales, una sinergia que ofrece como resultado una realimentación en el medio, de forma que los elementos usados como materia prima, dotan de capacidad de trabajo a otros sistemas en su estado de materia elaborada.

Orden

De Wikipedia, la enciclopedia libre
Este artículo trata sobre el concepto de orden. Para otros usos de este término, véase Orden (desambiguación).

Uno de los significados de orden es la propiedad que emerge en el momento en que varios sistemas abiertos, pero en origen aislados, llegan a interactuar por coincidencia en el espacio y el tiempo, produciendo, mediante sus interacciones naturales, una sinergia que ofrece como resultado una realimentación en el medio, de forma que los elementos usados como materia prima, dotan de capacidad de trabajo a otros sistemas en su estado de materia elaborada.

La capacidad de algunos sistemas de recordar el pasado (de tener memoria), produce en ese sistema la capacidad de establecer un método organizado y coordinado para repetir el logro alcanzado por selección natural, y acelerar el objetivo a conseguir. En ese proceso, se paga un precio: la pérdida de su individualidad, mayor dependencia de nuevos elementos que pueden existir gracias a una economía más holgada, pero ganando en especialización. Bajo este enfoque, el orden es la organización de las partes para hacer algo funcional y preciso, lo cual implica la presencia de un cauce que establece una transacción de cargas con menor coste y por lo tanto con potencial de desarrollo a una psicodinámica emergente, dando la oportunidad al observador de imputar una finalidad intencional y, como puede deducirse, de una acción inteligente.

Contenido

[ocultar]

[editar] Ámbitos de orden

En el ámbito del orden social, el orden se remite a la forma en la cual las comunidades se organizan. Así, existen las sociedades jerárquicas, que se basan en una organización social rígida y piramidal, o en sus antípodas las sociedades anarquistas, cuyo orden es mucho más flexible y requiere, en consecuencia, fuertes valores de conducta, como el respeto por la libertad del otro, la igualdad y la responsabilidad por los actos propios. En las diferentes formas de organización social, los factores determinantes son la cultura y los fenómenos particulares que hacen a la naturaleza de cada una de ellas, y no necesariamente las leyes escritas, las cuales tan sólo reflejan las leyes sociales creadas por la comunidad, o alguna de sus partes.

[editar] Otros puntos de vista

Bajo otro punto de vista, el orden no es únicamente una acción inteligente, sino todo aquello que funciona de una determinada manera. Así, aunque quien observa el orden y en última instancia lo define es un individuo inteligente, el orden se encuentra naturalmente en la disposición de sucesos u otros conceptos observables. Aquello que denominamos tiempo, presenta un orden natural para los sucesos y, guiados al menos por los conocimientos concretos del ser humano hasta el día de hoy, el orden cronológico es unidireccional e invariable.

Los antónimos de orden pueden ser, según el contexto en que sea utilizado, desorganización, desorden y caos.

De la misma forma, existen órdenes de órdenes, que solemos llamar estructuras. Existen multitud de estructuras en los más diversos campos tanto de la naturaleza como de la vida social.

[editar] Significados en diferentes disciplinas

Utilizado en masculino un orden puede referirse a un criterio de ordenamiento. En filosofía, orden (en griego cosmos) es lo que se opone al caos. En biología, orden es una de las categorías de la taxonomía. En ciencias sociales, generalmente se refiere al orden social o al orden público. En matemáticas, los diferentes tipos de orden son tratados por la teoría del orden.

Utilizado en femenino, una orden es un imperativo. En el catolicismo puede referirse a las Órdenes religiosas. Hay gran número de honores y condecoraciones en gran número de países que llevan el nombre de Orden.

[editar] Véase también

22/09/2010 20:02 petalofucsia #. Matemáticas Hay 2 comentarios.

MATEMÁTICAS: FÍSICA. CAUSALIDAD. En física, el término causalidad describe la relación entre causas y efectos, y es fundamental en todas las ciencias naturales, especialmente en física. En términos generales, la causalidad puede ser estudiada desde varias perspectivas: la filosófica, la de la computación y la estadística.

Causalidad (física)

De Wikipedia, la enciclopedia libre
Para otros usos de este término, véase Causalidad.

En física, el término causalidad describe la relación entre causas y efectos, y es fundamental en todas las ciencias naturales, especialmente en física. En términos generales, la causalidad puede ser estudiada desde varias perspectivas: la filosófica, la de la computación y la estadística.

Contenido

[ocultar]

[editar] Introducción

En física clásica se asumía que todos los eventos están causados por otros anteriores y que dicha causalidad es expresable en términos de leyes de la naturaleza. Dicha pretensión llegó a su punto más alto en la afirmación de Pierre-Simon Laplace. Laplace afirmó que si se conoce el estado actual del mundo con total precisión, uno puede predecir cualquier evento en el futuro. Esta perspectiva se conoce como determinismo o más precisamente determinismo causal.

Aunque el determinismo de Laplace parece correcto respecto a las ecuaciones aproximadas de la física clásica, la teoría del caos ha añadido pequeñas complicaciones. Muchos sistemas presentan una fuerte sensibilidad a las condiciones iniciales, lo que significa que condiciones iniciales muy similares en ciertos sistemas pueden conducir a comportamientos a largo plazo muy diferentes. Eso sucede por ejemplo en el tiempo atmosférico. Hacia 1987 era habitual usar superordenadores en la predicción del tiempo, por ejemplo el Cray X-MP del Centro Europeo para el Pronóstico del Tiempo a Medio Plazo, que operaba con una capacidad máxima de 800 megaflops, podía calcular en apenas media hora un pronóstico aceptable del tiempo para el día siguiente en todo el hemisferio. Y aunque cada día se realizaban pronósticos de los siguientes diez días, los resultados del pronóstico a partir del cuarto o quinto día diferían sensiblemente de lo previsto por el ordenador.[1]

Sin embargo, por encima de la impredictibilidad práctica causada por el comportamiento estocástico o caótico de los sistemas clásicos, está el hecho de que la mecánica cuántica presenta junto con una evolución determinista recogida en la ecuación de Schrödinger, una evolución no-determinista recogida en el postulado del colapso de la función de onda.

[editar] Mecánica relativista

De acuerdo con los postulados comunes de la física newtoniana, la causa precede al efecto en el tiempo. Sin embargo, en la física moderna, el concepto más simple de causalidad ha necesitado ser clarificado. Por ejemplo, en la teoría de la relatividad especial, el concepto de causalidad se mantiene, pero el significado de "preceder en el tiempo" sigue siendo absoluto y no depende del observador (aunque no pasa igual con el concepto de simultaneidad de conceptos no relacionados causalmente, que ahora sí pasan a depender del observador). Consecuentemente, el principio relativista de causalidad dice que la causa precede a su efecto para observadores inerciales. Esto implica que, en términos de la teoría de la relatividad especial, una condición necesaria para que A sea causa de B, es que B sea un evento que pertenece al cono de luz de A (en términos de distancias espacio-temporales se dice que A y B están separados por intervalo temporaloide). A pesar de algunas obras de ciencia ficción, en los supuestos bajo los cuales la teoría de la relatividad especial es adecuada para describir el mundo, resulta imposible, no sólo influir en el pasado, sino también en objetos distantes mediante señales que se muevan más rápidas que la velocidad de la luz.

En la teoría general de la relatividad, el concepto de causalidad se generaliza de la manera más directa posible: el efecto debe pertenecer al cono de luz futuro de su causa, aún en espacio-tiempos curvos; aunque pueden aparecer ciertas complicaciones, como cuando uno trata soluciones exactas de las ecuaciones de Einstein, como el Universo de Gödel, donde existen curvas temporales cerradas, y un observador puede verse a sí mismo en el pasado, y otra serie de peculiaridades que, no obstante, no incurren en ninguna paradoja.[2]

[editar] Mecánica cuántica

Nuevas sutilezas se toman en cuenta cuando se investiga la causalidad en mecánica cuántica no relativista y teoría cuántica de campos (mecánica cuántica relativista). En la teoría cuántica de campos, la causalidad está estrechamente relacionada con el principio de localidad. El análisis de ese principio es delicado, y muchas veces ese análisis pasa por el uso del teorema de Bell. De todas maneras, el resultado de dicho análisis parece depender, en parte, de desde qué interpretación de la mecánica cuántica se interpreten los resultados.

Sin embargo, se sospecha que, aún con todas estas sutilezas, el principio de causalidad sigue siendo un concepto válido de toda teoría física realista. Así, parece que la noción de que los eventos pueden ser ordenados en causas y efectos es necesaria para prevenir ciertas paradojas del mundo que conocemos.

La base de la causalidad física son los procesos energéticos que están gobernados por el principio físico de la conservación de la energía.

[editar] Principio de causalidad

El principio de causalidad postula que todo efecto -todo evento- debe tener siempre una causa (que, en idénticas circunstancias, una causa tenga siempre un mismo efecto se conoce como "principio de uniformidad"). Se usa para la búsqueda de leyes definidas, que asignan a cada causa su correspondiente efecto.

Este principio refleja un comportamiento mecánico de la naturaleza, que hasta el siglo XX se había aceptado e interpretado en un sentido determinista. No obstante, a principios de este siglo Heisenberg introdujo su principio de incertidumbre, que modificaba profundamente el principio de causalidad clásico.

Heisenberg y otros padres de la mecánica cuántica introdujeron un modelo de átomo que renunciaba a la visión clásica de un compuesto de partículas y ondas. Se concluyó que estaba condenado al fracaso cualquier intento de establecer analogías entre la estructura atómica y nuestra intuición sobre objetos macroscópicos. La formulación matemática de la teoría de Heisenberg se llamó inicialmente mecánica matricial, porque requería del uso de las matrices del álgebra lineal clásica. Esta formulación resultó complementaria de la mecánica ondulatoria, del físico austriaco Erwin Schrödinger.

Usando esta mecánica, los niveles de energía u órbitas de electrones se describen en términos probabilísticos: en general, de una misma causa no se deriva siempre un mismo efecto, sino que existe una variedad de posibles efectos. Sólo se puede predecir (aunque, en principio, con una fiabilidad determinista total) la probabilidad de que, cuando la causa se produzca, ocurra cada uno de los efectos.

Este comportamiento resulta extraño para nuestra experiencia ordinaria. Su explicación la podemos resumir en los siguientes puntos, que deben aceptarse como postulados avalados por miles de observaciones experimentales:

  • Existen propiedades de la materia (observables) que no se pueden medir simultáneamente (observables que no conmutan). Por ejemplo, la posición y la velocidad de una misma partícula sería un par de propiedades de este tipo. Para ilustrar esa situación con un análogo clásico burdo, piénsese que, si un microscopio es lo suficientemente sensible como para hacer visible un electrón, deberá enviar una cantidad mínima de luz u otra radiación apropiada sobre él, que lo haga visible. Pero el electrón es tan pequeño que este mínimo de radiación (digamos, un fotón) es suficiente para hacerle cambiar de posición apenas lo tocara, de modo que en el preciso instante de medir su posición, alteraríamos ésta.
  • Supongamos que hemos medido una de estas propiedades observables, de modo que conocemos con precisión su valor. Cuando un instante después midamos la segunda propiedad, obtendremos uno de los posibles valores de esta segunda propiedad, pero no podemos predecir antes cuál: sólo se puede predecir la probabilidad con la que cada uno de los valores posibles serán obtenidos.

Para algunos autores, desde el punto de vista filosófico, esto supone renunciar al principio de causalidad: podemos hallar dos sistemas físicos que han sido preparados exactamente del mismo modo, pero tales que, al medir una misma propiedad de ambos, obtenemos un resultado distinto en cada caso. No existe ninguna causa por la que hayamos obtenido los resultados diferentes: la Naturaleza no es determinista. Sin embargo, sí se pueden determinar con precisión las probabilidades de obtener las posibles medidas. Y como los objetos macroscópicos están formados por números gigantescos de partículas, las predicciones probabilísticas cuánticas acaban siendo, estadísticamente hablando, totalmente precisas, lo que hace de la Mecánica Cuántica una teoría extraordinariamente exacta.

La interpretación descrita de la mecánica cuántica es la que se ha impuesto con el tiempo, y se le llama interpretación de Copenhague en honor de la escuela del físico danés Niels Bohr. Inicialmente, la renuncia al principio de causalidad en esta interpretación no fue aceptada por muchos físicos, incluyendo a Einstein, quien afirmó: “Dios no juega a los dados”. De hecho, el propio Einstein, en colaboración con Podolski y Rosen, ideó un experimento (Paradoja EPR, por las siglas de sus autores) tal que las conclusiones de la interpretación de Copenhague parecían absurdas. Bohr mostró que, aunque muy extrañas, estas conclusiones no son absurdas. Experimentos de este tipo fueron llevados a cabo a finales del siglo XX por Alain Aspect, y han confirmado la interpretación de Copenhague.

Sin embargo, esta interpretación se enfrenta todavía a la llamada paradoja del gato de Schrödinger (remarquemos que Schrödinger, como Einstein, fue uno de los padres de la Mecánica Cuántica). Esta paradoja, que afecta a la definición de lo que es un proceso de medida (la distinción entre la materia observada y la mente del observador), no ha podido ser aún explicada de forma satisfactoria.

Existen multitud de efectos que se derivan del principio de incertidumbre. Uno de ellos, que afecta al ejemplo de incertidumbre posición-velocidad anterior, es la imposibilidad de la ausencia completa de energía cinética o, digamos, velocidad, para una partícula (ni siquiera en el cero absoluto). Si la energía cinética alcanzara el punto cero y las partículas quedaran totalmente inmóviles, sería posible confinarlas y determinar su posición con precisión arbitraria, a la vez que conoceríamos su velocidad (que sería cero). Por tanto, debe existir alguna “energía residual del punto cero”, incluso en el cero absoluto, para mantener las partículas en movimiento, y también, por así decirlo, nuestra incertidumbre. Esa energía “punto cero” se puede calcular, y resulta suficiente para evitar que el helio líquido se solidifique, incluso a temperaturas tan próximas como se quiera del cero absoluto (el cero en sí resulta inaccesible).

Las consecuencias del principio de incertidumbre se constatan en todas las partes de la microfísica, y acaban resultando asombrosas cuando se extrapolan al Universo en su conjunto. Así:

  • Desde los tiempos de Einstein, en 1930, se sabía que el principio de incertidumbre también llevaba a la imposibilidad de reducir el error en la medición de energía sin acrecentar la incertidumbre del tiempo durante el cual se toma la medida. (De hecho, al principio, Einstein creyó poder utilizar esta tesis como trampolín para refutar el principio de incertidumbre, pero también Bohr mostró que la tentativa de Einstein era errónea).
  • De esta versión de la incertidumbre se seguía que en un proceso subatómico se podía violar durante breves lapsos la ley de la conservación de la energía (siempre y cuando todo volviese al estado de conservación cuando concluyese ese lapso). En general, cuanto mayor sea la desviación de la conservación, tanto más breve será el intervalo de tiempo en que ésta es tolerable. El físico japonés Hideki Yukawa aprovechó esta noción para elaborar su teoría de los piones, confirmada experimentalmente.
  • Más aún, posibilitó la elucidación de ciertos fenómenos subatómicos presuponiendo que las partículas nacían de la nada como un reto a la energía de conservación, pero se extinguían antes del tiempo asignado a su detección, por lo cual eran sólo “partículas virtuales”. Hacia fines de la década 1940-1950, tres investigadores (premios Nobel de Física en 1965) elaboraron la teoría sobre esas partículas virtuales: los físicos norteamericanos Julian Schwinger y Richard Phillips Feynman, y el físico japonés Shin'ichirō Tomonaga. Los diagramas de Feynman son usados corrientemente en la física de partículas, donde llevan a predicciones extremadamente exactas.
  • A partir de 1976 se han producido especulaciones acerca de que el Universo comenzó como una pequeña pero muy masiva partícula virtual que se expandió con extrema rapidez y que aún sigue expandiéndose. Según este punto de vista, el Universo se formó de la Nada y podemos preguntarnos acerca de la posibilidad de que haya un número infinito de Universos que se formen (y, llegado el momento, acaben) en esta Nada.

En resumen, el principio de incertidumbre afectó profundamente al pensamiento de físicos y filósofos. Ejerció una influencia directa sobre la cuestión filosófica de causalidad, la relación entre causa y efecto. Pero sus implicaciones para la ciencia no son las que se suponen popularmente a menudo. Se puede leer que el principio de incertidumbre anula toda certeza acerca de la naturaleza, y muestra que, al fin y al cabo, la ciencia no sabe ni sabrá nunca hacia dónde se dirige, que el conocimiento científico está a merced de los caprichos imprevisibles de un Universo donde el efecto no sigue necesariamente a la causa. Pero tanto si esta interpretación es válida desde el ángulo filosófico como si no, el principio de incertidumbre no ha modificado un ápice la actitud del científico ante la investigación. Y esto por varios motivos:

  • La incertidumbre también existe a un nivel clásico. Por ejemplo, incluso si nos olvidamos de posibles efectos cuánticos, no se puede predecir con certeza el comportamiento de las moléculas individuales en un gas. Sin embargo, estas moléculas acatan ciertas leyes termodinámicas, y su conducta es previsible sobre una base estadística. Estas predicciones son infinitamente más precisas que las de las compañías aseguradoras, que planifican su actividad (y obtienen beneficios) calculando con índices de mortalidad fiables, aunque les sea imposible predecir cuándo morirá un individuo determinado.
  • Ciertamente, en muchas observaciones científicas, la incertidumbre es tan insignificante comparada con la escala correspondiente de medidas, que se la puede descartar para todos los propósitos prácticos. Uno puede determinar simultáneamente la posición y el movimiento de una estrella, o un planeta, o una bola de billar, o incluso un grano de arena con exactitud absolutamente satisfactoria.
  • La incertidumbre entre las propias partículas subatómicas no representa un obstáculo, sino una verdadera ayuda para los físicos. Se la ha empleado para entender el modelo atómico (que resultaba inestable desde el punto de vista no cuántico), esclarecer hechos sobre la radiactividad, sobre la absorción de partículas subatómicas por los núcleos, y otros muchos acontecimientos subatómicos. En ello se emplea una economía lógica y razonabilidad muy superior de lo que hubiera sido esperable sin él.

Es cierto que el principio de incertidumbre o, en general, la física cuántica, se enfrenta a la paradoja no resuelta del problema de la medición (el gato de Schrödinger). Pero ésta tiene sus orígenes en la distinción entre mente y materia, determinismo y libre albedrío, y profundiza en ella como nunca antes habían imaginado los filósofos. El principio de incertidumbre significa que el Universo es más complejo de lo que se suponía, pero no irracional.

[editar] Referencias

  1. O. Stewart, 2001, p.169
  2. «Revisiting the Light Cone of the Goedel Universe». arXiv.

[editar] Bibliografía

[editar] Véase también

[editar] Enlaces externos

22/09/2010 20:00 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: CAUSA. Dados dos eventos A y B, A es causa de B si se cumplen una serie de condiciones lógicas, dos sucesos importantes.

Causa

De Wikipedia, la enciclopedia libre
Para otros usos de este término, véase Causa (desambiguación).

Dados dos eventos A y B, A es causa de B si se cumplen una serie de condiciones lógicas, dos sucesos importantes.

  • La ocurrencia de A va acompañada de la ocurrencia de B, o si examinamos, representamos numéricamente el grado en que ocurren A y B, entonces encontramos una correlación positiva entre ambas variables.
  • La no-ocurrencia de B implica que tampoco podrá hallarse la ocurrencia de A, aunque la ocurrencia de B no tiene por qué estar ligada necesariamente a la concurrencia de A.

Cuando dos eventos A y B cumplen las dos condiciones anteriores decimos que existe una relación causal entre ambos: en concreto "A es causa de B" o equivalentemente "B es un efecto de A".

La idea de causa intuitivamente surge del intento de explicarnos lo que ocurre a nuestro alrededor mediante un determinado esquema lógico subyacente que nos permite relacionar unas cosas con otras mediante conexiones necesarias. Esta capacidad para establecer conexiones causales es una habilidad cognitiva básica de primates superiores, algunos mamíferos superiores e incluso algunos invertebrados como el pulpo de mar.

Esta habilidad cognitiva básica es importante precisamente porque existe cierta evidencia empírica de que que siempre que se dan las mismas circunstancias como causas, se producirá siempre el mismo efecto. Eso es lo que entendemos por principio de causalidad que según puede formular de un modo un tanto naïf como "todo lo que sucede en el mundo, en la Naturaleza tiene una causa" (también se suele parafrasear una proposición de Aristóteles: "Todo lo que se mueve, se mueve por otro").

 

Contenido

[ocultar]

[editar] Causa en Ciencias naturales y Ciencias sociales

La idea de causa aparece en ciencias naturales y sociales en varios contextos:

  1. En física donde el término suele denominarse causalidad, en mecánica newtoniana se admite además que la causa precede siempre al efecto.
  2. En estadística donde es analizado por la estadística inferencial.
  3. En ciencias sociales el concepto suele aparecer ligado a un análisis estadístico de variables observadas (por tanto en general se trata del mismo concepto manejado en el contexto 2).
  4. En ciencias naturales diferentes de la física y en procesos en los que no podemos reducir la concurrencia de eventos a un mecanimos físico simple (caso 1), la idea de causa aparece en procesos complejos entre los que hemos observado una relación causal. Así tras las ecuaciones empíricas se supone hay un proceso físico causal que lleva a una conexión necesaria entre ciertos eventos.

[editar] Causa en filosofía

Plantilla:Causalidad (filosofía) La idea de "causa" ha suscitado un buen número de debates filosóficos, desde los primeros intentos filosóficos. Aristóteles concluye el libro de los Segundos analiticos con el modo en que la mente humana llega a conocer las verdades básicas o premisas primarias o primeros principios, que no son innatos, ya que es posible desconocerlos durante gran parte de nuestra vida. Tampoco pueden deducirse a partir de ningún conocimiento anterior, o no serían primeros principios. Afirma que los primeros principios se derivan por inducción, de la percepción sensorial, que implanta los verdaderos universales en la mente humana. De esta idea proviene la máxima escolástica "nada hay en el intelecto que no haya estado antes en los sentidos" (Nihil est in intellectu, quod prius non fuerit in sensu). Al mantener que "conocer la naturaleza de una cosa es conocer, ¿por qué es?" y que "poseemos conocimiento científico de una cosa sólo cuando conocemos su causa".

Aristóteles postuló cuatro tipos mayores de causa como los términos medios más buscados de demostración: la forma definible; un antecedente que necesita un consecuente; la causa eficiente; la causa final.[1]

En la filosofía occidental, el concepto de causa como "conexión necesaria" fue criticado por el filósofo David Hume.

En las relaciones causales encontramos que:

  • Observamos que las cosas no están aisladas, sino que unas están ligadas a otras en un proceso de interacción. Unas cosas suceden a otras, y siempre en el mismo orden.
  • Un conjunto de hechos definen una situación, y a este momento siempre le sucede otra situación y siempre la misma.
  • Al primer conjunto que define la situación lo llamamos causa, y a la segunda situación la llamamos efecto.[2]
  • La ley de la causalidad no debe confundirse con el Principio de razón suficiente. De la confusión de ambos se ha seguido tradicionalmente la demostración de la existencia de Dios a partir del principio de causalidad. Tal paso es ilegítimo, como bien establecido está en el pensamiento científico y filosófico.
  • Sin embargo la ley de la causalidad es el esquema fundamental de la investigación científica, suponiendo que la mejor forma de comprender y explicar es conocer las causas, porque por un lado podemos prevenir y por otro controlar los efectos, en definitiva dominar los sucesos naturales.

[editar] Notas al pie

  1. Vulgarmente causa material, causa formal, causa eficiente y causa final
  2. La palabra efecto, proviene del latín effectus y tiene una gran cantidad de significados, ligados muchos de ellos a la experimentación científica, porque su significado principal indica que efecto es aquello que se consigue por virtud de una causa o el fin para que se hace una cosa. La relación que existe entre causa y efecto se llama causalidad. La causalidad es objeto de profundos análisis en el campo filosófico.

[editar] Véase también

22/09/2010 19:59 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: RELACIONES DE CAUSALIDAD. En estadística, la causalidad se refiere a una relación de necesidad de coocurrencia de dos variables estadísticas correlacionadas, probar causalidad entre dos variables implica además de que guarden una correlación positiva, estudiar en casos donde una pueda aparecer sin la otra, etc.

Causalidad (estadística)

De Wikipedia, la enciclopedia libre

En estadística, la causalidad se refiere a una relación de necesidad de coocurrencia de dos variables estadísticas correlacionadas, probar causalidad entre dos variables implica además de que guarden una correlación positiva, estudiar en casos donde una pueda aparecer sin la otra, etc.

Contenido

[ocultar]

[editar] Introducción

En epidemiología, el hecho de que dos fenómenos estén estadísticamente relacionados no implica necesariamente que uno sea causa del otro. Para poder afirmar esto último es necesario disponer de dos grupos comparables (constituidos por individuos elegidos al azar), y someter a la exposición al factor estudiado a uno de ellos, estudiando las diferentes tasas de aparición del efecto.

Esto, en la mayoría de los casos es imposible por razones éticas y prácticas, por lo que se recurre a estudios analíticos retrospectivos: Se toman dos grupos, uno con el efecto (por ejemplo, enfermedad) y otro sin él ("sanos"), y se estudia, de manera retrospectiva, cuál fue el grado de exposición a la hipotética causa (factor de riesgo) en cada caso.

No obstante ello los estudios analíticos prospectivos suelen ser los que garantizan - dentro de los límites de confianza estadística fijados - las asociaciones causales más fuertes.

A falta, entonces, de una prueba experimental idónea se han postulado una serie de criterios cuyo cumplimiento garantiza que la asociación no sea "casual", sino "causal". Los más conocidos son los formulados por Sir Austin Bradford Hill:

  • Fuerza de la asociación, estimable mediante las medidas estadísticas correspondientes.
  • Gradiente o efecto dosis-respuesta (a mayor dosis de la causa, mayor cantidad del efecto).
  • Secuencia temporal.
  • Consistencia, o repetición del mismo resultado en otros estudios.
  • Coherencia con otros hallazgos.
  • Analogía con otros fenómenos.
  • Plausibilidad biológica, es decir, existencia de un mecanismo biológico plausible que explique la relación causa-efecto.
  • Especificidad.
  • Evidencia experimental, demostración mediante estudios experimentales.

[editar] Factor condicionante

Un factor condicionante es una variable que parece influir causalmente en otra variable, llamada efecto; aun cuando el factor condicionante no sea la única causa eficiente para el efecto. Formalmente A es un factor condicionante de B si se cumple la sigueinte relación entre las probabilidades condicionadas:

(1) P(B|A) > P(B|bar{A}), qquad mbox{con} P(A) ne 0

Es decir, la probabilidad de que se dé B dado que sabemos que está ocurriendo A, es mayor que la probabilidad de que se dé B dado que sabemos que no ocurre A. Esto generaliza la idea de causa, ya que si "A es causa de B" la relación (1) se cumple trivialmente ya que se tiene:

P(B|A) =1, P(B|bar{A}) =0

La idea del factor condicionante, tiene la ventaja de que en ocasiones es difícil demostrar estadísticamente que "A es causa de B", aunque es relativamente fácil de argumentar la validez estadística de que "A es un factor condicionante de B".

[editar] Formas alternativas

Si además sucede que 1 > P(A) > 0, la relación (1) también puede escribirse como:

(1b) P(B) > P(B|bar{A}),qquad mbox{o} qquad P(B|A) > P(B)

Por ejemplo para demostrar la primera relación, basta considerar las siguientes identidades:

begin{matrix} P(B) = P(B|A)P(A) + P(B|bar{A})P(bar{A}) = P(B|A)P(A) + P(B|bar{A})(1-P(A))  Rightarrow P(B) = P(B|bar{A}) + P(A)[P(B|A) - P(B|bar{A})] ge P(B|bar{A}) +varepsilon end{matrix}

Siendo:

delta:=P(B|A) - P(B|bar{A})> 0varepsilon = P(A)delta > 0

Similarmente, se puede demostrar la otra identidad:

begin{matrix} P(B) = P(B|A)P(A) + P(B|bar{A})P(bar{A}) = P(B|A)(1-P(bar{A})) + P(B|bar{A})P(bar{A})  Rightarrow P(B) = P(B|A) + P(bar{A})[P(B|bar{A}) - P(B|A)] le P(B|A) - bar{varepsilon} end{matrix}

Donde:

bar{varepsilon} = P(bar{A})delta > 0

[editar] Véase también

[editar] Enlaces externos

22/09/2010 19:57 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: RELACIÓN MATEMÁTICA. Una relación , de los conjuntos es un subconjunto del producto cartesiano. El concepto de relación implica la idea de enumeración, de algunos de los elementos, de los conjuntos que forman tuplas.

Relación matemática

De Wikipedia, la enciclopedia libre

Una relación R_{ }^{ }, de los conjuntos  A_1, A_2, ldots , A_n es un subconjunto del producto cartesiano

Rsubseteq A_1 times A_2 times ldots times A_n

Una Relación binaria es una relación entre dos conjuntos.

El concepto de relación implica la idea de enumeración, de algunos de los elementos, de los conjuntos que forman tuplas.

 R(a_1,a_2, ldots ,a_n) qquad mbox{o bien} qquad (a_1,a_2, ldots ,a_n) in R

Un caso particular es cuando todos los conjuntos de la relación son iguales:  A_1 = A_2 = ldots = A_n en este caso se representa  A times A times ldots times A como  A^n , , pudiéndose decir que la relación pertenece a A a la n.

Rsubseteq A^n

[editar] Tipos de relaciones

En las relaciones se diferencian los tipos según el número de conjuntos en el producto cartesiano, que es el número de términos de la relación:

Relación unaria: un solo conjunto  R  subseteq A , ; R(a)Relación binaria: con dos conjuntos  R  subseteq A_1 times A_2 , ; R(a_1,a_2)Relación ternaria: con tres conjuntos  R  subseteq A_1 times A_2  times A_3 , ; R(a_1,a_2,a_3)Relación cuaternaria: con cuatro conjuntos  R  subseteq A_1 times A_2 times A_3 times A_4 , ; R(a_1,a_2,a_3,a_4)...Relación n-aria: caso general con n conjuntos  R  subseteq A_1 times A_2 ldots times A_n , ; R(a_1,a_2,ldots,a_n)

[editar] Véase también

22/09/2010 19:56 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: FAMILIA (MATEMÁTICAS). En matemáticos, la noción de familia es una generalización de aquella de continuación, continuación acabada o continuación referenciada por los enteros. Así se podrá hablar, en algèbre lineal, de la familia de vecteurs (u1, u2, … , un), que es una familia acabada, o de la familia dénombrable (un)no ' ∈ No Una familia es indexada siempre, aunque lo es a veces implicitement, por ejemplo en de los locutions como « familia libre » o « familia generadora ». .

Familia (matemáticas)

Un artículo de WikiLingue, la Wikipedia multiLingüe, la enciclopedia libre.

En matemáticos, la noción de familia es una generalización de aquella de continuación, continuación acabada o continuación referenciada por los enteros. Así se podrá hablar, en algèbre lineal, de la familia de vecteurs (u1, u2, … , un), que es una familia acabada, o de la familia dénombrable (un)no ' ∈ No  Una familia es indexada siempre, aunque lo es a veces implicitement, por ejemplo en de los locutions como « familia libre » o « familia generadora ». .

Familia referenciada : definición

Una familia (x_i)_{iin I} indexada por un conjunto I de elementos xi de un conjunto E es una aplicación definida sobre I a valores en E. Se trata pues de una terminología y de una notación, mejor adaptadas a ciertos usos, para la noción conocida de aplicación (o de función). Los elementos de I son llamados indicio (o índice). El elemento de la familia (x_i)_{iin I} de indicio i es xi.

Cuándo Se habla de elemento de una familia, se trata de un elemento del conjunto imagen de la familia en tanto que aplicación : un elemento de la familia (x_i)_{iin I} es el uno de los xi.

Cuándo Se habla de la cardinalité de una familia, se trata a priori de la cardinalité del conjunto de sus indicios (o de modo equivalente de la cardinalité del graphe de la familia en tanto que aplicación). Esto se dice puede siempre precisar : familia sobre un conjunto de indicios de cardinalité tal. Así una familia acabada es una familia cuyo conjunto de los indicios (y no de los elementos) está acabado, una familia infinita es una familia cuyo conjunto de los indicios está infinito, una familia dénombrable es una familia cuyo conjunto de los indicios está dénombrable etc.

Se llama igualmente continuación una familia cuyo conjunto de los indicios es el conjunto de los enteros o un bajo-juntos de éste, acabado o infinito (los no ' primeros enteros, los enteros no nuls ...). Pero esto no es exclusivo : por ejemplo, en algèbre lineal, se habla con mucho gusto de familia de vecteurs, incluso en este caso.

Más generalmente, se podrá hablar, teoría de los conjuntos, de continuación para una familia cuyo conjunto de los indicios es un ordinal, o incluso un conjunto « explicitement » bien ordenado.

Teoría axiomatique de los conjuntos

En teoría de los conjuntos una aplicación es el más a menudo identificada a su graphe : es un conjunto de parejas. Una aplicación definida sobre I es un conjunto de parejas tales que cada elemento de I apparait una y una sola vez primera composante de una pareja de este conjunto. Es pues también la definición de familia de conjuntos indexados por I. Se se preocupa pocos el conjunto de llegada en este caso. Se muestra sin embargo que sí {HAi}iI es una familia de conjuntos, entonces se puede bien hablar del conjunto de los TIENE :i 

{HAi | iI}  « es » un conjunto.

Eso puede demostrarse utilizando esencialmente el hecho que una aplicación es un conjunto de parejas y el esquema de axiomes de comprensión (hace falta volver a la definición de pareja teoría de los conjuntos, y utilizar el axiome de la reunión).

Artículos connexes

Indexed familyestás:Familia de conjuntos

22/09/2010 19:46 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: GRUPO. En álgebra abstracta, la teoría de grupos estudia las estructuras algebraicas conocidas como grupos. Sus objetivos son, entre otros, la clasificación de los grupos, sus propiedades y sus aplicaciones tanto dentro como fuera de las matemáticas.

Teoría de grupos

De Wikipedia, la enciclopedia libre
Diagrama de Cayley del grupo libre de orden dos.

En álgebra abstracta, la teoría de grupos estudia las estructuras algebraicas conocidas como grupos. Sus objetivos son, entre otros, la clasificación de los grupos, sus propiedades y sus aplicaciones tanto dentro como fuera de las matemáticas.

Los grupos sirven como pilar a otras estructuras algebraicas más elaboradas como los anillos, los cuerpos o los espacios vectoriales. La teoría de grupos tiene muchas aplicaciones en el campo de la física y la química, y es potencialmente aplicable en situaciones caracterizadas por la simetría.

El orden de un grupo es su cardinalidad; en base a él, los grupos pueden clasificarse en grupos de orden finito de orden infinito. La clasificación de los grupos simples de orden finito es uno de los mayores logros matemáticos del siglo XX.

Contenido

[ocultar]

[editar] Historia

Las raíces históricas de la teoría de grupos son la teoría de las ecuaciones algebraicas, la teoría de números y la geometría. Euler, Gauss, Lagrange, Abel y Galois fueron los investigadores iniciadores de ésta ciencia. Galois es reconocido como el primer matemático que relacionó ésta teoría con la teoría de cuerpos resultando en la teoría de Galois. Otros importantes matemáticos en este campo incluyen a Cayley, Emil Artin, Emmy Noether, Sylow entre muchos otros. Fue Walter von Dick quién en 1882, dio la moderna definición de grupo.

[editar] Definiciones

[editar] Grupos

Un grupo (G, circ) es un conjunto G en el que se ha definido una ley de composición interna circ que satisface los siguientes axiomas:

  1. Asociatividad: a circ (b circ c)=(a circ b) circ c, forall a,b,c in G
  2. Elemento neutro: exists e in G : e circ a=a circ e=a
  3. Elemento simétrico: forall a in Gquad exists a^{-1} in G : acirc a^{-1}=a^{-1} circ a=e

Por lo tanto, un grupo está formado por un conjunto de objetos abstractos o símbolos, y por una ley de composición interna que los relaciona. Dicha ley de composición interna indica cómo deben ser manipulados los objetos del grupo.

Se dice que un grupo es abeliano o conmutativo cuando verifica además la propiedad conmutativa:

a circ b = b circ a quad forall a in G

 

[editar] Notación

Se habla de notación aditiva cuando se representa la ley de composición interna como "a + b", y el elemento neutro como " 0 ". Por otro lado, la notación multiplicativa es aquella en la que la ley de composición interna se representa como "a cdot b", o "ab", y el elemento neutro como " 1 ".

[editar] Ejemplos

  • (mathbb{Z},+), el conjunto de números enteros con la suma usual, es un grupo abeliano; donde el elemento neutro es el 0, y el simétrico de x, es -x.
  • (mathbb{R},+), el conjunto de los números reales con la suma usual, es un grupo abeliano; donde el elemento neutro es el 0, y el simétrico de x, es -x.
  • (mathbb{R}setminus{0},cdot), el conjunto de los números reales (excluyendo al 0) con la multiplicación, es un grupo abeliano; donde el elemento neutro es el 1, y el simétrico de x es 1/x. Notar que al no tener el cero elemento simétrico multiplicativo, se lo debe excluir.
  • El conjunto de todas las biyecciones de un conjunto X - simbolizado por S(X) - junto con la composición de funciones, es un grupo no abeliano (si la cardinalidad de X es mayor que dos) y se llama grupo simétrico de X.
  • El conjunto de matrices rectangulares de dimensiones ntimes m con la suma, es un grupo abeliano.
  • El conjunto de matrices cuadradas con determinante diferente de cero con la multiplicación (Grupo general lineal), no es abeliano.
  • Las clases de homotopía de trayectorias continuas S^1to X en un espacio topológico X forman un grupo no necesariamente abeliano. Ésta construcción es el grupo fundamental de X.
    • El grupo fundamental de un círculo (circle, cercle, Kreis) es el grupo cíclico infinito; mathbb{Z}.
    • El de la esfera S2 es trivial = 0.
    • De un toro es mathbb{Z}oplus mathbb{Z}
    • De un toro sin un disco es el grupo libre de orden dos, F2. De un toro sin dos discos disjuntos; F3.
    • Del plano proyectivo es mathbb{Z}_2
    • El de la botella de Klein tiene la presentación; langle a,b: aba=brangle y que corresponde al producto semidirecto de mathbb{Z} con mathbb{Z}.

[editar] Operaciones

Entre dos grupos G, H puede haber morfismos, i.e. funciones que son compatibles con las operaciones en cada uno de ellos. Si phicolon Gto H es un homomorfismo entonces obedece

phi(ab)=phi(a)phi(b),

donde hemos hecho la convención de escribir ab para indicar la operación de a con b en G, y φ(a)φ(b) la operación de φ(a) con φ(b) en H.

El conjunto φS es un subgrupo en H cuando S es un subgrupo en G.

Si transformamos un conmutador: aba − 1b − 1 se obtiene: φ(aba − 1b − 1) = φ(a)φ(b)(φ(a)) − 1(φ(b)) − 1.

[editar] Categoría de grupos

Desde el punto de vista de la teoría de categorías, la teoría de grupos podría catalogarse como una categoría llamada categoría de grupos, debido a que en ella se estudia a los grupos y sus morfismos. La categoría de grupos es muy grande, pero puede armarse una relación de equivalencia en esta categoría para que se factorice: la relación entre grupos de ser isomorfos reduce cuestiones estructurales de la categoría de grupos a la categoría de grupos-módulo-los-isomorfos. En esta reducción la operación de unión disjunta la convierte en una categoría monoidal.

[editar] Teoría geométrica de los grupos

Los más actuales temas de investigación en la teoría de grupos tienen que ver con las modernas técnicas de la topología. Una manera estándar de construir nuevos grupos a partir de los conocidos son los

  • productos libres,
  • productos libres amalgamados y las
  • HNN-extensiones.

La gran variedad de técnicas topológicas pueden ser aplicadas desde que se sabe que es posible construir siempre un espacio topológico (de hecho un CW-complejo dos-dimensional) de tal manera que el grupo fundamental de este espacio es el grupo dado.

 

[editar] Referencias

  1. Referencia global en Encyclopaedia of Mathematics
  • Alexandroff, P. S. (1967). Introducción a la Teoría de los Grupos. Buenos Aires: Editorial Universitaria de Buenos Aires, Colección Cuadernos Nº 132, 152 páginas, en rústica. Traducción del ruso: Juana Elisa Quastler. 
  • Adler, Irving (1970). La Nueva Matemática. Buenos Aires: Editorial Universitaria de Buenos Aires, Colección Ciencia Joven, 288 páginas, en rústica. Traducción del inglés: Jorge Jáuregui. Original: The New Mathematics, The John Day Company, New York. 

[editar] Véase también

22/09/2010 19:43 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: GRUPO (MATEMÁTICA). En álgebra abstracta, un grupo es un conjunto en el que se define una operación binaria (i.e. un magma), que satisface ciertos axiomas detallados más abajo. La rama de la matemática que estudia los grupos se llama teoría de grupos.

Grupo (matemática)

De Wikipedia, la enciclopedia libre

En álgebra abstracta, un grupo es un conjunto en el que se define una operación binaria (i.e. un magma), que satisface ciertos axiomas detallados más abajo. La rama de la matemática que estudia los grupos se llama teoría de grupos.

Contenido

[ocultar]

[editar] Definición

Sea una estructura algebraica formada por un conjunto A, sobre cuyos elementos se ha definido una operación o ley de composición interna binaria denotada por " circ ". Se dice que la estructura ( A, circ ) es un grupo con respecto a la operación  circ si satisface las siguientes propiedades:

  1. Operación interna: para cualesquiera dos elementos del conjunto A operados bajo  circ , el resultado siempre pertenece al mismo semigrupo A. Es decir:     forall x, y in A : quad     x circ y in A
  2. Asociatividad: para cualesquiera elementos del conjunto A no importa el orden en que se operen las parejas de elementos, mientras no se cambie el orden de los elementos (ver grupo abeliano), siempre dará el mismo resultado. Es decir:     forall x, y, z in A: quad    x circ (y circ z) =    (x circ y) circ z ;
  3. Con elemento neutro. Para todo elemento x que pertenezca al conjunto A, existe un único elemento e de A, que cumple:     forall x in A : quad    exists ! , e : quad    e circ x = x circ e = x
  4. Con elemento simétrico respecto de la operación  circ , si se cumple:     forall x in A , quad    exists bar{x} in A : quad    bar{x} circ x =    x circ bar{x} = e

Si además se cumple la propiedad conmutativa:

  1. Conmutatividad: un conjunto A tiene la propiedad conmutativa respecto a la operación interna  circ si:
    forall a, b in A: quad    a circ b =    b circ a ;

Se dice que es un grupo conmutativo o abeliano.

[editar] Notación

Es frecuente utilizar a la hora de definir grupos dos notaciones:

  • La notación aditiva.
    • Operación: +, llamada suma.
    • Elemento neutro: 0.
    • Elemento opuesto de un elemento x del grupo: -x.

Históricamente la terminología multiplicativa precedió a la aditiva. La operación de grupo no es necesariamente una adición o una multiplicación en el sentido que nos resulta familiar en la aritmética elemental. Por ejemplo, una operación de grupo puede ser una sustitución o una rotación. Cualquier conjunto de elementos y una operación que a dos elementos asocie una tercera en el conjunto, puede ser un grupo si cumple con las condiciones o propiedades de grupo pedidas. Sus elementos no son siempre números en el sentido ordinario de la aritmética elemental. Asimismo en algunos casos puede ser más cómodo utilizar alguna de las dos notaciones y en otros resulta indiferente. Es posible que se utilicen indistintamente, siempre y cuando esto no mueva a confusión. Cuando se trata de las operaciones familiares de suma y multiplicación, es impropio usar una notación opuesta a la operación.

[editar] Tipos de grupos

  • Grupo abeliano (o conmutativo). Se denomina grupo conmutativo o abeliano a aquel grupo que verifica la Propiedad conmutativa, es decir a cdot b = b cdot a forall a,b in G
    • Grupo abeliano con torsión Definición de torsión: Diremos que un elemento a in A posee torsión o, que es de torsión, si para algún n in mathbb {N}, a^n = 1 . Si a es de torsión, entonces el menor número natural n con la propiedad an = 1, coincide con el orden de a. Definición de grupo abeliano con torsión: Un grupo abeliano A se dice con torsión si es igual a 0 o si posee elementos no nulos de torsión.
    • Grupo abeliano de torsión. Un grupo abeliano A se dice de torsión si todo elemento de A es de torsión.
  • Grupo finito. Es un grupo con un número finito de elementos.
  • Grupo de Lie. Es un grupo que además tiene estructura de variedad diferenciable.
  • Grupo cíclico. Es un grupo conmutativo, finito o infinito, que puede ser generado por multiplicación reiterada de un sólo elemento.
  • Grupo libre.
  • Grupos de Klein.

[editar] Ejemplos

  • La suma define estructura de grupo conmutativo en el conjunto de los números enteros (mathbb{Z}), en el de los números racionales (mathbb{Q}), en los números reales (mathbb{R}) y en los números complejos (mathbb{C}). Los vectores libres del espacio, con la suma de vectores, forman un grupo conmutativo. La suma de matrices define una estructura de grupo conmutativo en las matrices con coeficientes reales (digamos) con un número de columnas y filas prefijado. Las funciones reales de variable real, con la suma de funciones, también forman un grupo conmutativo, al igual que las sucesiones de números reales con la suma de sucesiones.
  • El producto define estructura de grupo conmutativo en los números racionales no nulos, los números reales positivos, los números complejos de módulo 1, etc.
  • Las matrices cuadradas de n columnas con coeficientes reales y determinante distinto de cero forman un grupo con el producto de matrices, grupo que no es conmutativo cuando n>1.

Otros ejemplos de grupos no conmutativos se obtienen al considerar grupos de transformaciones, donde la operación es la composición de aplicaciones y el elemento neutro es la identidad:

Todos estos últimos ejemplos lo son del concepto de Grupo de Lie, que son los grupos definidos por operaciones continuas sobre curvas superficies o variedades de dimensión mayor.

La importancia crucial de la teoría de grupos tanto en Física como en Matemática radica en que los isomorfismos de cualquier estructura, de cualquier teoría, forman siempre un grupo y que, en los casos más importantes, los grupos están clasificados: se conocen listas que agotan todos los que hay. La clasificación de los grupos de Lie, llevada a cabo esencialmente por Élie Cartan, es un punto culminante de la matemática europea, sólo comparable a la construcción de los 5 poliedros regulares realizada por la matemática griega. Al igual que ésta última es la determinación de todas las figuras geométricas simétricas posibles, la clasificación de grupos es la determinación de todas las posibles simetrías de cualquier estructura. Así, podemos conocer a priori los grupos de automorfismos de cualquier teoría geométrica. Además, de acuerdo con el Programa de Erlangen de Felix Klein, este grupo de automorfismos reconstruye la correspondiente teoría geométrica.

Algo parecido sucede en Física, donde se ha descubierto que el grupo de simetrías del lagrangiano de un sistema determina propiedades fundamentales asociadas a las partículas elementales de dicho sistema. De hecho, aunque aún no conozcamos las teorías físicas por venir, la clasificación de grupos de Lie ya nos proporciona la lista de los posibles grupos de simetrías infinitesimales.

[editar] Curiosidades

Un grupo puede tener infinitos elementos, (como Z con la suma, o los números reales no nulos con el producto) o por el contrario tener un número finito de éstos.

Dado un número natural n, los restos que se obtienen al dividir por n (es decir, los números 0, 1, ..., n - 1) forman un grupo, donde la suma a + b es precisamente el resto al dividir la suma ordinaria por n. Este grupo se denota con Z/nZ y se suele llamar grupo de enteros módulo n. Así, el grupo Z/12Z es el que usamos para calcular con las horas de un reloj, y Z/24Z si queremos distinguir las horas de la mañana de la tarde.

Además, en Z/nZ el conjunto de los números primos relativos con n (denotado (Z/nZ)*) forma un grupo cuando la operación ab es el resto al dividir por n el producto usual. Sin embargo, se puede definir un grupo para otros números aunque no sean primos. Por ejemplo, el grupo (Z/12Z)* el cual sólo tiene 4 elementos. ¿Por qué sólo 4 elementos? Porque puesto que para ser un grupo, cada elemento ha de tener un inverso. Si tomamos algún número que tenga algún factor común con 12, por ejemplo el 10, éste no puede ser multiplicado por otro número de forma que el resto de la división entre 12 sea 1. Es decir, 10 no tendría inverso. Así, sólo son elementos del grupo (Z/12Z) aquellos números coprimos con 12. Si n hubiese sido primo, todos los menores que él serían coprimos con él, excepto el cero, luego su grupo tendría n - 1 elementos.

Se dice que un grupo es cíclico si verifica estar generado por un solo elemento; es decir, supongamos que un conjunto A es grupo con respecto a una operación *. Si existe un elemento g en A tal que cualquier otro elemento de A se obtiene operando g o su inverso g-1 reiteradamente:

A={ ..., g^{-r}, ..., g^{-1}, g^0=1, g^1=g, g^2, ..., g^r, ...}={g^r|rinmathbb{Z}},

entonces se dice que (A,*) es un grupo cíclico y que g es un generador de A, lo cual se denota por A=<g>.

La clasificación de grupos cíclicos afirma que los finitos son isomorfos a Z/nZ, y los infinitos con Z.

[editar] Véase también

Grupo
Monoide
Semigrupo
Magma
Operación matemática
Operación interna
Asociatividad
Elemento neutro
Elemento simétrico

22/09/2010 19:42 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ¿VA ANTES EL GRUPO O LA PAREJA EN MATEMÁTICAS? SI QUIERE PENSAR EN LA FAMILIA DE NÚMEROS YA PUEDE. Grupo (del italiano gruppo), la pluralidad de elementos que forman un conjunto.

Grupo

De Wikipedia, la enciclopedia libre

Grupo (del italiano gruppo), la pluralidad de elementos que forman un conjunto, puede hacer referencia a:

Contenido

[ocultar]

[editar] En matemáticas

[editar] En astronomía

[editar] En física

[editar] En química

[editar] En geología

  • Grupo es una unidad de formaciones geológicas:

[editar] En biología

[editar] En hematología

[editar] En sociología y antropología

[editar] En lingüística

  • Grupo es un conjunto de lenguas emparentadas:

[editar] En economía

[editar] En relaciones internacionales

[editar] En parlamentarismo

[editar] En tecnología

[editar] En música

[editar] En arte

[editar] Topónimos

[editar] Otros usos

[editar] Véase también



22/09/2010 19:40 petalofucsia #. Matemáticas Hay 3 comentarios.

MATEMÁTICAS: ESTADÍSTICA. RELACIONAR USOS Y PARÁMETROS (MODA) EN EL DISEÑO Y EL FORMATEADO DE USOS COMO LOS VEHÍCULOS DE TRANSPORTE. En estadística se llama valor representativo de la población parámetro estadístico, medida estadística o parámetro poblacional a un valor representativo de una población,[1] como la media aritmética, la proporción de individuos que presentan determinada característica, o la desviación típica.[2]

Ç

PORCHE

AUDI

MERCEDES

RENAULT

JAGUAR XF

CITROËN GT

Diccionario de la lengua española © 2005 Espasa-Calpe:

uso

  1. m. Acción y resultado de usar:
    lo he comprado para vuestro uso y disfrute.
  2. Ejercicio o práctica general de una cosa:
    el uso de las armas.
  3. Costumbre o práctica que está de moda o es característica de alguien o de una época:
    usos amorosos del siglo xviii.
  4. uso de razón Capacidad de raciocinio que se adquiere pasada la primera niñez.
  5. al uso loc. adv. Según la moda o la costumbre:
    en la boda, las señoras lucirán pamelas al uso
    ♦ No confundir con huso.


Diccionario de la lengua española © 2005 Espasa-Calpe:

usar

  1. tr. Hacer que un objeto sirva para algo:
    no comas con los dedos, usa los cubiertos. También intr.
  2. Servirse de algo:
    ¿me dejas usar tu coche?
  3. Llevar habitualmente cierta prenda o adorno personal:
    usa gemelos.
  4. intr. Hacer o practicar algo habitualmente o por costumbre:
    usaba dar un paseíto al caer la tarde.
  5. prnl. Estar de moda:
    esa expresión ya no se usa.


Preguntas en los foros con la(s) palabra(s) 'uso' en el título:


'uso' también aparece en estas entradas

Diccionario de sinónimos y antónimos © 2005 Espasa-Calpe:

uso

  • desgaste, deterioro, ajamiento, envejecimiento, deslucimiento, decadencia, raedura, roce
  • utilización, empleo, dedicación, ocupación, fin, función, usufructo
    • Antónimos: desuso, inutilidad
  • costumbre, hábito, rutina, práctica

Diccionario de sinónimos y antónimos © 2005 Espasa-Calpe:

usar

  • utilizar, emplear, consumir, dedicar, disponer, manejar, explotar, servirse, valerse
  • acostumbrar, soler, frecuentar
  • estilarse

'uso' también aparece en estas entradas

uso.

(Del lat. usus).

1. m. Acción y efecto de usar.

2. m. Ejercicio o práctica general de algo.

3. m. moda.

4. m. Modo determinado de obrar que tiene alguien o algo.

5. m. Empleo continuado y habitual de alguien o algo.

6. m. Der. Derecho no transmisible a percibir de los frutos de la cosa ajena los que basten a las necesidades del usuario y de su familia.

7. m. Der. Forma del derecho consuetudinario inicial de la costumbre, menos solemne que esta y que suele convivir como supletorio con algunas leyes escritas.

~ de razón.

1. m. Posesión del natural discernimiento, que se adquiere pasada la primera niñez.

2. m. Tiempo en que se descubre o se empieza a reconocer este discernimiento en los actos del niño o del individuo.

al ~.

1. loc. adv. Conforme o según el uso.

andar alguien al ~.

1. loc. verb. Acomodarse al tiempo, contemporizar con las cosas según piden las ocasiones.

a ~.

1. loc. adv. al uso.

entrar alguien en los ~s.

1. loc. verb. Seguir lo que se estila y practica por otros, y conformarse con los usos y costumbres del país o pueblo donde reside.

estar en buen ~ lo que ya se ha usado.

1. loc. verb. coloq. No estar estropeado.

V.

amor al uso



Real Academia Española © Todos los derechos reservados

Parámetro estadístico

De Wikipedia, la enciclopedia libre

Cscr-featured.svg
La media aritmética como resumen de la vejez de un país

En estadística se llama valor representativo de la población parámetro estadístico, medida estadística o parámetro poblacional a un valor representativo de una población,[1] como la media aritmética, la proporción de individuos que presentan determinada característica, o la desviación típica.[2]

Un parámetro es un número que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadística.[3] El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.[4] [5]

Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: modelizar la realidad.[6]

El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.

Por ejemplo, suele ofrecerse como resumen de la "juventud" de una población la media aritmética de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal población.

Contenido

[ocultar]

Enfoque descriptivo [editar]

Gráficas de distribuciones normales para distintos valores de sus dos parámetros

Un parámetro estadístico es, como se ha dicho, un número que resume una cantidad de datos. Este enfoque es el tradicional de la Estadística descriptiva.[7] [8] [9] En este sentido, su acepción se acerca a la de medida o valor que se compara con otros, tomando una unidad de una determinada magnitud como referencia.

Por su parte, la facción más formal de la Estadística, la Estadística matemática y también la Inferencia estadística utilizan el concepto de parámetro en su acepción matemática más pura, esto es, como variable que define una familia de objetos matemáticos en determinados modelos. Así se habla, por ejemplo, de una distribución Normal de parámetros μ y σ como de una determinada familia de distribuciones con una distribución de probabilidad de expresión conocida, en la que tales parámetros definen aspectos concretos como la esperanza, la varianza, la curtosis, etc. Otro ejemplo común en este sentido es el de la distribución de Poisson, determinada por un parámetro, λ; o la Distribución binomial, determinada por dos parámetros, n y p. Para los ojos de la Estadística matemática el hecho de que estas distribuciones describan situaciones reales y los citados parámetros signifiquen un resumen de determinado conjunto de datos es indiferente.

Controversia [editar]

Como se ha dicho, los parámetros estadísticos, en el enfoque descriptivo que aquí se adopta, substituyen grandes cantidades de datos por unos pocos valores extraídos de aquellos a través de operaciones simples. Durante este proceso se pierde parte de la información ofrecida originalmente por todos los datos. Es por esta pérdida de datos por lo que la estadística ha sido tildada en ocasiones de una falacia. Por ejemplo, si en un grupo de tres personas una de ellas ingiere tres helados, el parámetro que con más frecuencia se utiliza para resumir datos estadísticos, la media aritmética (del número de helados ingeridos por el grupo), sería igual a 1 ( = frac{0+0+3}{3}), valor que no parece resumir fielmente la información. Ninguna de las personas se sentiría identificada con la frase resumen "he ingerido un helado de media".[10]

Un ejemplo menos conocido, pero igual de ilustrativo acerca de la claridad de un parámetro es la distribución exponencial, que suele regir los tiempos medios entre determinados tipos de sucesos. Por ejemplo, si la vida media de una bombilla es de 8.000 horas, más del 50% de las veces no llegará a esa media. Igualmente, si un autobús pasa cada 10 minutos de media, hay una probabilidad mayor del 50% de que pase menos de 10 minutos entre un autobús y el siguiente.

Otro ejemplo que suele ofrecerse con frecuencia para argumentar en contra de la estadística y sus parámetros es que, estadísticamente hablando, la temperatura media de una persona con los pies en un horno y la cabeza en una nevera es ideal.

Benjamín Disraeli, un descreído de las estadísticas.

Quizás por situaciones como estas, que en general muestran un profundo desconocimiento de lo que los parámetros representan en realidad y de su uso conjunto con otras medidas de centralización o dispersión, el primer ministro inglés Benjamín Disraeli sentenció[11] primero y Mark Twain popularizó más tarde[12] la siguiente afirmación:

Hay mentiras, grandes mentiras y estadísticas.

Hay otros personajes que también han advertido sobre la simplificación que supone la estadística, como el profesor Aaron Levenstein, quien afirmaba:

Las estadísticas son como los bikinis, lo que muestran es sugerente, pero lo que esconden es vital.

Por su parte, el escritor y comediante inglés Bernard Shaw sentenció:[13]

La estadística es una ciencia que demuestra que si mi vecino tiene dos coches y yo ninguno, los dos tenemos uno.

o el personaje ficticio Homer Simpson de la popular serie de televisión Los Simpson en una entrevista acerca de las proporciones en uno de sus capítulos:[14]

¡Oh!, la gente sale con estadísticas para probar cualquier cosa, el 14% del mundo lo sabe.
Guionistas de la serie Los Simpson

Propiedades deseables en un parámetro [editar]

Según Yule[15] un parámetro estadístico es deseable que tenga las siguientes propiedades:

  • Se define de manera objetiva, es decir, es posible calcularlo sin ambigüedades, generalmente mediante una fórmula matemática. Por ejemplo, la media aritmética se define como la suma de todos los datos, dividida por el número de datos. No hay ambigüedad: si se realiza ese cálculo, se obtiene la media; si se realiza otro cálculo, se obtiene otra cosa. Sin embargo, la definición de moda como el "valor más frecuente", puede dar lugar a confusión cuando la mayor frecuencia la presentan varios valores distintos.
  • No desperdicia, a priori, ninguna de las observaciones. Con carácter general, un parámetro será más representativo de una determinada población, cuántos más valores de la variable estén implicados en su cálculo. Por ejemplo, para medir la dispersión puede calcularse el recorrido, que sólo usa dos valores de la variable objeto de estudio, los extremos; o la desviación típica, en cuyo cálculo intervienen todos los datos del eventual estudio.
  • Es interpretable, significa algo. La mediana, por ejemplo, deja por debajo de su valor a la mitad de los datos, está justo en medio de todos ellos cuando están ordenados. Esta es una interpretación clara de su significado.
  • Es sencillo de calcular y se presta con facilidad a manipulaciones algebraicas. Se verá más abajo que una medida de la dispersión es la desviación media. Sin embargo, al estar definida mediante un valor absoluto, función definida a trozos y no derivable, no es útil para gran parte de los cálculos en los que estuviera implicada, aunque su interpretación sea muy clara.
  • Es poco sensible a las fluctuaciones muestrales. Si pequeñas variaciones en una muestra de datos estadísticos influyen en gran medida en un determinado parámetro, es porque tal parámetro no representa con fiabilidad a la población. Así pues es deseable que el valor de un parámetro con esta propiedad se mantenga estable ante las pequeñas oscilaciones que con frecuencia pueden presentar las distintas muestras estadísticas. Esta propiedad es más interesante en el caso de la estimación de parámetros. Por otra parte, los parámetros que no varían con los cambios de origen y escala o cuya variación está controlada algebraicamente, son apropiados en determinadas circunstancias como la tipificación.

Principales parámetros [editar]

Habitualmente se agrupan los parámetros en las siguientes categorías:

Medidas de posición.[16]

Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:

  • Las medidas de tendencia central: medias, moda y mediana.
  • Las medidas de posición no central: cuantiles (cuartiles, deciles y percentiles).
Medidas de dispersión.[17]

Resumen la heterogeneidad de los datos, lo separados que estos están entre sí. Hay dos tipos, básicamente:

  • Medidas de dispersión absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, desviación típica y meda.
  • Medidas de dispersión relativa, que informan de la dispersión en términos relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variación, el coeficiente de apertura, los recorridos relativos y el índice de desviación respecto de la mediana.
Medidas de forma.[18]

Su valor informa sobre el aspecto que tiene la gráfica de la distribución. Entre ellas están los coeficientes de asimetría y los de curtosis.

Otros parámetros.

Además, y con propósitos más específicos, existen otros parámetros de uso en situaciones muy concretas, como son las proporciones, los números índice, las tasas y el coeficiente de Gini.

Medidas de posición [editar]

Las medidas de posición son las más utilizadas para resumir los datos de una distribución estadística. Se trata de valores de la propia variable[19] que, en cierto modo, sustituyen la información provista por los datos.

Medidas de tendencia central o centralización [editar]

Artículo principal: Medidas de tendencia central

Son valores que suelen situarse hacia el centro de la distribución de datos. Los más destacados son las medias o promedios (incluyendo la media aritmética, la media geométrica y la media armónica), la mediana y la moda.

Media aritmética o promedio [editar]
La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).
Artículo principal: Media aritmética

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos.[20]

Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética como

 overline{x} = frac{x_1 + x_2 + ... + x_n}{n} = frac{sum_{i=1}^n x_i}{n}

Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas.

Sus propiedades son:[21]

  • Su cálculo es muy sencillo y en él intervienen todos los datos.
  • Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:
 frac{sum_{i=1}^n (x_i-overline{x})}{n} = frac{sum_{i=1}^n x_i}{n} - frac{sum_{i=1}^n overline{x}}{n} = overline{x} - overline{x} = 0
  • Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor prefijado, esto es, el valor de  frac{sum_{i=1}^n (x_i-k)^2}{n} es mínimo cuando k = overline{x}. Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza.
xi' = axi + b entonces overline{x'} = a overline{x} + b, donde overline{x'} es la media aritmética de los xi', para i = 1, ..., n y a y b números reales.

Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene también algunos inconvenientes, como son:

  • Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la cantidad y amplitud de los intervalos que se consideren.
  • Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto menos homogéneos son los datos, menos información proporciona. Dicho de otro modo, poblaciones muy distintas en su composición pueden tener la misma media.[22] Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95, pongamos por caso, tendría una estatura media de 1,95, evidentemente, valor que representa fielmente a esta homogénea población. Sin embargo, un equipo de estaturas más heterogéneas, 2,20, 2,15, 1,95, 1,75 y 1,70, por ejemplo, tendría también, como puede comprobarse, una estatura media de 1,95, valor que no representa a casi ninguno de sus componentes.
  • Es muy sensible a los valores extremos de la variable. Por ejemplo, en el cálculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de mil empleados "normales" que ganen 1.000 €, siendo la media de aproximadamente 2.000 €.
Moda [editar]
Artículo principal: Moda (estadística)

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.[23] En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues sólo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolación.

Sus principales propiedades son:

  • Cálculo sencillo.
  • Interpretación muy clara.
  • Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".[24]

Inconvenientes.

  • Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del número de intervalos y de su amplitud.
  • Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.
  • No siempre se sitúa hacia el centro de la distribución.
  • Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).
Mediana [editar]
Artículo principal: Mediana (estadística)

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.[25] Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

       underbrace{1, 1, 1, 1, 1, 1, }_{Mitad ; inferior} ;       underbrace{color{Red} 2, }_{Mediana ;} ;        underbrace{2, 2, 2, 3, 3, 4}_{Mitad ; superior}

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

       underbrace{1, 1, 1, 1, 1, }_{Valores ; inferiores} ;       underbrace{color{Red} 1, 2, }_{Valores ; intermedios} ;       underbrace{2, 2, 3, 3, 4}_{Valores ; superiores}

Se toma como mediana  1,5 = frac{{color{Red}1}+{color{Red}2}}{2}

En este ejemplo basado en una tabla real de percentiles usada en pediatría, puede comprobarse que una niña de 24 meses con un peso de 13 kg estaría en el percentil 75º, esto es, su peso es superior al 75% de las niñas de su edad. La mediana correspondería, aproximadamente, a 12 kg (intersección de la línea curva más oscura con la línea horizontal correspondiente al valor 12 en el eje vertical, para esa misma edad).

Existen métodos de cálculo más rápidos para datos más numerosos (véase el artículo principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto por interpolación.

Propiedades de la mediana como parámetro estadístico:[26]

  • Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
  • Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no está acotado.
  • No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien como la media aritmética.

Medidas de posición no central [editar]

Artículo principal: Medidas de posición no central

Directamente relacionados con la anterior, se encuentran las medidas de posición no central, también conocidas como cuantiles. Se trata de valores de la variable estadística que dejan por debajo de sí determinada cantidad de los datos. Son, en definitiva, una generalización del concepto de la mediana. Mientras que ésta deja por debajo de sí al 50% de la distribución, los cuantiles pueden hacerlo con cualquier otro porcentaje.[27] Se denominan medidas de posición porque informan, precisamente, de la posición que ocupa un valor dentro de la distribución de datos.

Tradicionalmente se distingue entre cuartiles, si se divide la cantidad de datos en cuatro partes antes de proceder al cálculo de los valores que ocupan cada posición; deciles, si se divide los datos en diez partes; o percentiles, que dividen la población en cien partes.

Ejemplos: si se dice que una persona, tras un test de inteligencia, ocupa el percentil 75, ello supone que el 75% de la población tiene un cociente intelectual con un valor inferior al de esa persona. Este criterio se usa por las asociaciones de superdotados, que limitan su conjunto de miembros a aquellas que alcanzan determinado percentil (igual o superior a 98 en la mayoría de los casos).

El ejemplo que se muestra en la imagen de la derecha es el correspondiente al cálculo inverso, esto es, cuando se desea conocer el percentil correspondiente a un valor de la variable, en lugar del valor que corresponde a un determinado percentil.

Otras medidas de posición central son la media geométrica y la media armónica que, aunque tienen determinadas propiedades algebraicas que podrían hacerlas útiles en determinadas circunstancias, su interpretación no es tan intuitiva como la de los parámetros anteriores.[28]

Comentarios sobre las medidas de posición [editar]

Este tipo de parámetros no tienen por qué coincidir con un valor exacto de la variable y, por tanto, tampoco pueden usarse con carácter general para hacer pronósticos. Por ejemplo, si se dice que la media aritmética de los hijos de las familias de un país es de 1,2, no es posible encontrar familias con ese valor en concreto. Un segundo ejemplo: a ninguna fábrica de zapatos se le ocurriría fabricar los suyos con tallas únicamente correspondientes al valor promedio, ni siquiera tienen por qué ser estas tallas las más fabricadas, pues en tal caso sería más apropiado atender a la moda de la distribución de tallas de los eventuales clientes.

La elección de uno u otro parámetro dependerá de cada caso particular, de los valores de la variable y de los propósitos del estudio. Su uso indiscriminado puede ser deliberadamente tendencioso o involuntariamente sesgado, convirtiéndose, de hecho, en un abuso.[10] Puede pensarse, por ejemplo, en la siguiente situación: un empresario publica que el salario medio en su empresa es de 1.600 €. A este dato, que en determinadas circunstancias podría considerarse muy bueno, podría llegarse si la empresa tuviese cuatro empleados con salarios de 1.000 € mensuales y el salario del jefe, incluido en la media, fuese de 4.000 € al mes:[29]

bar{x} = frac{1000+1000+1000+1000+4000}{5} = 1600

Con carácter general y a modo de resumen podría decirse que la media aritmética es un parámetro representativo cuando la población sigue una distribución normal o es bastante homogénea; en otras situaciones de fuerte dispersión, habría que decantarse por la mediana. La moda es el último recurso (y el único) cuando de describir variables cualitativas se trata.

Medidas de dispersión [editar]

Artículo principal: Dispersión (matemática)
Diagrama de caja que muestra la dispersión gráficamente, usando los cuartiles como referencia. Entre Q1 y Q3 (rango intercuartílico) se encuentran el 50% de las observaciones.

Las medidas de posición resumen la distribución de datos, pero resultan insuficientes y simplifican excesivamente la información. Estas medidas adquieren verdadero significado cuando van acompañadas de otras que informen sobre la heterogeneidad de los datos. Los parámetros de dispersión miden eso precisamente, generalmente, calculando en qué medida los datos se agrupan entorno a un valor central. Indican, de un modo bien definido, lo homogéneos que estos datos son. Hay medidas de dispersión absolutas, entre las cuales se encuentran la varianza, la desviación típica o la desviación media, aunque también existen otras menos utilizadas como los recorridos o la meda; y medidas de dispersión relativas, como el coeficiente de variación, el coeficiente de apertura o los recorridos relativos. En muchas ocasiones las medidas de dispersión se ofrecen acompañando a un parámetro de posición central para indicar en qué medida los datos se agrupan en torno de él.[30]

Medidas de dispersión absolutas [editar]

Recorridos [editar]

El recorrido o rango de una variable estadística es la diferencia entre el mayor y el menor valor que toma la misma. Es la medida de dispersión más sencilla de calcular, aunque es algo burda porque sólo toma en consideración un par de observaciones. Basta con que uno de estos dos datos varíe para que el parámetro también lo haga, aunque el resto de la distribución siga siendo, esencialmente, la misma.

Existen otros parámetros dentro de esta categoría, como los recorridos o rangos intercuantílicos, que tienen en cuenta más datos y, por tanto, permiten afinar en la dispersión. Entre los más usados está el rango intercuartílico, que se define como la diferencia entre el cuartil tercero y el cuartil primero. En ese rango están, por la propia definición de los cuartiles, el 50% de las observaciones. Este tipo de medidas también se usa para determinar valores atípicos. En el diagrama de caja que aparece a la derecha se marcan como valores atípicos todos aquellos que caen fuera del intervalo [Li, Ls] = [Q1 - 1,5·Rs, Q3 + 1,5·Rs], donde Q1 y Q3 son los cuartiles 1º y 3º, respectivamente, y Rs representa la mitad del recorrido o rango intercuartílico, también conocido como recorrido semiintercuartílico.[31]

Desviaciones medias [editar]
Artículo principal: Desviación media

Dada una variable estadística X y un parámetro de tendencia central, c, se llama desviación de un valor de la variable, xi, respecto de c, al número |xi - c|. Este número mide lo lejos que está cada dato del valor central c, por lo que una media de esas medidas podría resumir el conjunto de desviaciones de todos los datos.

Así pues, se denomina desviación media de la variable X respecto de c a la media aritmética de las desviaciones de los valores de la variable respecto de c, esto es, si

X = {x_1, , x_2, , ...,, x_n}, entonces  DM_c = frac{sum_{i=1}^n left| x_i - c right|}{n}

De este modo se definen la desviación media respecto de la media (c = overline{x}) o la desviación media respecto de la mediana (c = overline{Me}), cuya interpretación es sencilla en virtud del significado de la media aritmética.[30]

Sin embargo, el uso de valores absolutos impide determinados cálculos algebraicos que obligan a desechar estos parámetros, a pesar de su clara interpretación, en favor de los siguientes.

Varianza y desviación típica [editar]
Artículos principales: Varianza y desviación típica
Conjunto de datos estadísticos de media aritmética 50 (línea azul) y desviación típica 20 (líneas rojas).

Como se vio más arriba, la suma de todas las desviaciones respecto al parámetro más utilizado, la media aritmética, es cero. Por tanto si se desea una medida de la dispersión sin los inconvenientes para el cálculo que tienen las desviaciones medias, una solución es elevar al cuadrado tales desviaciones antes de calcular el promedio. Así, se define la varianza como:[32]

 {sigma^2} = frac{ sumlimits_{i=1}^n left( x_i - overline{x} right) ^ 2 }{n},

o sea, la media de las desviaciones respecto de la media, al cuadrado.

La desviación típica, σ, se define como la raíz cuadrada de la varianza, esto es,

 {sigma} = sqrt{sigma ^2}

Para variables agrupadas en intervalos, se usan las marcas de clase (un valor apropiado del interior de cada intervalo) en estos cálculos.

Propiedades:[32]

  • Ambos parámetros no se alteran con los cambios de origen.
  • Si todos los valores de la variable se multiplican por una constante, b, la varianza queda multiplicada por b2.
  • En el intervalo (overline{x} - ksigma, , overline{x} + ksigma) se encuentran, al menos, el 100(1-frac{1}{k^2})% de las observaciones (véase Desigualdad de Tchebyschev).[33]

Esta última propiedad muestra la potencia del uso conjunto de la media y la desviación típica como parámetros estadísticos, ya que para valores de k iguales a 1 y 2, respectivamente, se obtiene que:

  • En el intervalo (overline{x} - sigma, , overline{x} + sigma) están, al menos, el 75% de los datos.
  • En el intervalo (overline{x} - 2sigma, , overline{x} + 2sigma) están, al menos, el 89% de los datos.

Se cumple la siguiente relación entre los parámetros de dispersión:

D_{Me} leq D_{overline{x}} leq sigma

donde D_{Me}, , D_{overline{x}}, y σ son, respectivamente, la desviación media respecto de la mediana, la desviación media respecto de la media y la desviación típica (véase Desviación media).

Meda [editar]

Se llama meda o desviación mediana a la mediana de las desviaciones respecto de la media. Es una medida de dispersión que tiene, por su propia definición, las mismas propiedades que la mediana. Por ejemplo, no se ve afectada por valores extremos o atípicos.[34] No se utiliza demasiado en estadística.

Medidas de dispersión relativa [editar]

Son parámetros que miden la dispersión en términos relativos, un porcentaje o una proporción, por ejemplo, de modo que permiten una sencilla comparación entre la dispersión de distintas distribuciones.[35]

Coeficiente de variación de Pearson [editar]
Artículo principal: Coeficiente de variación

Se define como  C_V = frac{sigma}{bar{x}} , donde σ es la desviación típica y bar{x} es la media aritmética.

Se interpreta como el número de veces que la media está contenida en la desviación típica. Suele darse su valor en tanto por ciento, multiplicando el resultado anterior por 100. De este modo se obtiene un porcentaje de la variabilidad.

Su principal inconveniente es que en el caso de distribuciones cuya media se acerca a cero, su valor tiende a infinito e incluso resulta imposible de calcular cuando la media es cero. Por ello no puede usarse para variables tipificadas.

Coeficiente de apertura [editar]

Se define como el cociente entre los valores extremos de la distribución de datos, esto es, dada una distribución de datos estadísticos x1, x2, ..., xn, su coeficiente de apertura, CA es C_A = frac{macute{a}x(x_i)}{macute{imath}n(x_i)}, ; i = 1, ..., n

Se usa para comparar salarios de empresas.

Recorridos relativos [editar]

Dado Re, el recorrido de una distribución de datos estadísticos, el recorrido relativo, RR es R_R = frac{R_e}{bar{x}}, donde {bar{x}} es la media aritmética de la distribución.

Dada una distribución de datos estadísticos con cuartiles Q1, Q2 y Q3, el recorrido intercuartílico relativo, RIQR se define como[36] R_{IQR} = frac{Q_3 - Q_1}{Q_2}

Por otra parte, se define el recorrido semiintercuartílico relativo, RSIR, como R_{SIR} = frac{Q_3 - Q_1}{Q_3 + Q_1}

Índice de desviación respecto a la mediana [editar]

Se define como V_{Me} = frac{D_{Me}}{Me}, donde DMe es la desviación media respecto de la mediana y Me es la mediana de una distribución de datos estadísticos dada.

Medidas de forma [editar]

La campana de Gauss, curva que sirve de modelo para el estudio de la forma de una distribución.

Las medidas de forma caracterizan la forma de la gráfica de una distribución de datos estadísticos. La mayoría de estos parámetros tiene un valor que suele compararse con la campana de Gauss, esto es, la gráfica de la distribución normal, una de las que con más frecuencia se ajusta a fenómenos reales.

Medidas de asimetría [editar]

Artículo principal: Asimetría estadística

Se dice que una distribución de datos estadísticos es simétrica cuando la línea vertical que pasa por su media, divide a su representación gráfica en dos partes simétricas. Ello equivale a decir que los valores equidistantes de la media, a uno u otro lado, presentan la misma frecuencia.

En las distribuciones simétricas los parámetros media, mediana y moda coinciden, mientras que si una distribución presenta cierta asimetría, de un tipo o de otro, los parámetros se sitúan como muestra el siguiente gráfico:

Posiciones relativas de parámetros centrales.svg

Ello puede demostrarse fácilmente si se tiene en cuenta la atracción que la media aritmética siente por los valores extremos, que ya se ha comentado más arriba y las definiciones de mediana (justo en el centro de la distribución, tomando el eje de abscisas como referencia) y moda (valor que presenta una ordenada más alta).

Por consiguiente, la posición relativa de los parámetros de centralización pueden servir como una primera medida de la simetría de una distribución.

Otras medidas más precisas son el coeficiente de asimetría de Fisher, el coeficiente de asimetría de Bowley y el coeficiente de asimetría de Pearson.

Medidas de apuntamiento o curtosis [editar]

Tres distribuciones con distintos grados de apuntamiento.
Artículo principal: Curtosis

Con estos parámetros se pretende medir cómo se reparten las frecuencias relativas de los datos entre el centro y los extremos, tomando como comparación la campana de Gauss.

El parámetro usado con más frecuencia para esta medida es el coeficiente de curtosis de Fisher, definido como:

gamma_2 = frac{sum_{i=1}^n (x_i-bar{x})^4}{nsigma^4}-3,

aunque hay otros como el coeficiente de curtosis de Kelley o el coeficiente de curtosis percentílico.

La comparación con la distribución normal permite hablar de distribuciones platicúrticas o más aplastadas que la normal; distribuciones mesocúrticas, con igual apuntamiento que la normal; y distribuciones leptocúrticas, esto es, más apuntadas que la normal.[37]

Por último, existen otras medidas para decidir sobre la forma de una distribución con ajuste a modelos menos usuales como los que se muestran en las siguientes gráficas:

Forma distribucion.svg

Otros parámetros [editar]

Se presentan en este apartado otros parámetros que tienen aplicación en situaciones muy concretas, por lo que no se incluyen entre los grupos anteriores, aunque tienen cabida en este artículo por su frecuente uso en medios de comunicación y su facultad de resumir grandes cantidades de datos, como ocurre con las medidas tratadas hasta ahora.

Proporción [editar]

Artículo principal: Proporción

La proporción de un dato estadístico es el número de veces que se presenta ese dato respecto al total de datos. Se conoce también como frecuencia relativa y es uno de los parámetros de cálculo más sencillo. Tiene la ventaja de que puede calcularse para variables cualitativas.

Por ejemplo, si se estudia el color de ojos de un grupo de 20 personas, donde 7 de ellas los tienen azules, la proporción de individuos con ojos azules es del 35% (= 7/20%).

El dato con mayor proporción se conoce como moda (véase, más arriba).

En inferencia estadística existen intervalos de confianza para la estimación de este parámetro.

Número índice [editar]

Artículo principal: Número índice

Un número índice es una medida estadística que permite estudiar las fluctuaciones o variaciones de una magnitud o de más de una en relación al tiempo o al espacio. Los índices más habituales son los que realizan las comparaciones en el tiempo. Algunos ejemplos de uso cotidiano de este parámetro son el índice de precios o el IPC[38]

Tasa [editar]

Artículo principal: Tasa (índice)
Coeficiente de Gini en el mundo (2007-2008)

La tasa es un coeficiente que expresa la relación entre la cantidad y la frecuencia de un fenómeno o un grupo de fenómenos. Se utiliza para indicar la presencia de una situación que no puede ser medida en forma directa.[38] Esta razón se utiliza en ámbitos variados, como la demografía o la economía, donde se hace referencia a la tasa de interés.

Algunos de los más usados son: tasa de natalidad, tasa de mortalidad, tasa de crecimiento demográfico, tasa de fertilidad o tasa de desempleo.

Coeficiente de Gini [editar]

Artículo principal: Coeficiente de Gini

El índice o coeficiente de Gini es un parámetro de dispersión usado para medir desigualdades entre los datos de una variable o la mayor o menor concentración de los mismos.

Este coeficiente mide de qué forma está distribuida la suma total de los valores de la variable. Se suele usar para describir salarios. Los casos extremos de concentración serían aquel en los que una sola persona acapara el total del dinero disponible para salarios y aquel en el que este total está igualmente repartido entre todos los asalariados.[39]

Momentos [editar]

Artículos principales: Momento estándar y Momento centrado

Los momentos son una forma de generalizar toda la teoría relativa a los parámetros estadísticos y guardan relación con una buena parte de ellos.

Dada una distribución de datos estadísticos x1, x2, ..., xn, se define el momento central o momento centrado de orden k como

mu_k = frac{sum_{i=1}^n (x_i - bar{x})^k}{n}

Para variables continuas la definición cambia sumas discretas por integrales (suma continua), aunque la definición es, esencialmente, la misma.[40]

De esta definición y las propiedades de los parámetros implicados que se han visto más arriba, se deduce inmediatamente que:

mu_0 = 1; ; mu_1 = 0; ; mu_2 = sigma^2; ;

y que

gamma_1 = frac{mu_3}{mu_2^3}; ; ;  gamma_2 = frac{mu_4}{mu_2^4}

Se llama momento no centrado de orden k a la siguiente expresión:

m_k = frac{sum_{i=1}^n (x_i)^k}{n}

De la definición se deduce que:

m_0 = 1; ; m_1 = bar{x}; ; m_2 - m_1^2 = sigma^2;

Usando el Binomio de Newton puede obtenerse la siguiente relación entre los momentos centrados y no centrados:

mu_k = sum_{i=1}^n (-1)^k {kchoose i} m_{k-i} m_1 ^i

Los momentos de una distribución estadística la caracterizan unívocamente.[41]

Parámetros bidimensionales [editar]

Artículo principal: Estadística bidimensional

En estadística se estudian en ocasiones varias características de una población para compararlas, estudiar su dependencia o correlación o realizar cualquier otro estudio conjunto. El caso más común de dos variables se conoce como estadística bidimensional.[42]

Un ejemplo típico es el de un estudio que recoja la estatura (denotémosla por X) y el peso (sea Y) de los n individuos de una determinada población. En tal caso, fruto de la recogida de datos, se obtendría una serie de parejas de datos (xi, yi), con i = 1, ..., n, cada una de las cuales estaría compuesta por la estatura y el peso del individuo i, respectivamente.

En los estudios bidimensionales, cada una de las dos variables que entran en juego, estudiadas individualmente, pueden resumirse mediante los parámetros que se han visto hasta ahora. Así, tendría sentido hablar de la media de las estaturas (bar{X}) o la desviación típica de los pesos (σY). Incluso para un determinado valor de la primera variable, xk, cabe hacer estudios condicionados. Por ejemplo, la mediana condicionada a la estatura xk sería la mediana de los pesos de todos los individuos que tienen esa estatura. Se denota Me/x=xk.

Sin embargo existen otros parámetros que resumen características de ambas distribuciones en su conjunto. Los más destacados son el centro de gravedad, la covarianza y el coeficiente de correlación lineal.

Centro de gravedad [editar]

Dadas dos variables estadísticas X e Y, se define el centro de gravedad como la pareja (bar{X}, bar{Y}), donde bar{X} y bar{Y} son, respectivamente, las medias aritméticas de las variables X e Y.

El nombre de este parámetro proviene de que en una representación de las parejas del estudio en una nube de puntos, en la que cada punto tuviese un peso proporcional a su frecuencia absoluta, las coordenadas (bar{X}, bar{Y}) corresponderían, precisamente, al centro de gravedad como concepto físico.[43]

Covarianza [editar]

Artículo principal: Covarianza

La covarianza o varianza conjunta de una distribución bidimensional se define como:

sigma_{xy} = frac 1n sum_{i=1}^n { (x_i - overline{x})(y_i - overline{y})}

La interpretación de este parámetro tiene que ver con la eventual correlación lineal de las dos variables. Una covarianza positiva implica una correlación directa y una negativa, una correlación inversa.[44] Por otra parte, es un parámetro imprescindible para el cálculo del coeficiente de correlación lineal o los coeficientes de regresión, como se verá más abajo.

En su contra tiene que se ve excesivamente influenciada, al igual que ocurría con la media aritmética, por los valores extremos de las distribuciones y los cambios de escala.

Coeficiente de correlación lineal [editar]

Artículo principal: Coeficiente de correlación
Variación del coeficiente de correlación lineal en función de la nube de puntos asociada.

Se trata de un coeficiente que permite determinar la bondad del ajuste de la nube de puntos por una recta.

Se define como: r = frac{sigma_{xy}}{sigma_x sigma_y}, donde σxy es la covarianza y σx y σy, las desviaciones típicas respectivas de las distribuciones implicadas.

El coeficiente de correlación lineal toma valores entre -1 y 1. En esa escala, mide la correlación del siguiente modo:

  • La correlación lineal es más fuerte cuanto más cerca esté de -1 o 1.
  • La correlación lineal es más débil cuanto más próximo a cero sea r.[45]

El diagrama de la derecha ilustra cómo puede variar r en función de la nube de puntos asociada:

Otros parámetros bidimensionales son, el coeficiente de correlación de Spearman, los coeficientes de correlación no paramétricos, el coeficiente de determinación o los coeficientes de regresión lineal.

Al igual que con distribuciones unidimensionales, existe una forma equivalente de desarrollar la teoría relativa a los parámetros estadísticos bidimensionales usando los momentos.

Los parámetros en la inferencia estadística [editar]

En ocasiones los parámetros de una determinada población no pueden conocerse con certeza. Generalmente esto ocurre porque es imposible el estudio de la población completa por cuestiones como que el proceso sea destructivo (p. e., vida media de una bombilla) o muy caro (p.e., audiencias de televisión). En tales situaciones se recurre a las técnicas de la inferencia estadística para realizar estimaciones de tales parámetros a partir de los valores obtenidos de una muestra de la población.[46]

Se distingue entonces entre parámetros y estadísticos. Mientras que un parámetro es una función de los datos de la población, el estadístico lo es de los datos de una muestra. De este modo pueden definirse la media muestral, la varianza muestral o cualquier otro párametro de los vistos más arriba.

Por ejemplo, dada una muestra estadística de tamaño n, (x_1, x_2, ..., x_n), de una variable aleatoria X con distribución de probabilidad F(x,θ), donde θ es un conjunto de parámetros de la distribución, se definiría la media muestral n-ésima como:

bar{X}_n = T(x_1,x_2,...,x_n) = frac{1}{n} sum_{i=1}^n x_i = frac{x_1+x_2+...+x_n}{n}

En el caso concreto de la varianza muestral, suele tomarse, por sus mejores propiedades como estimador, la siguiente:

 S_n^2 = frac{1}{n-1} sum_{i=1}^n (X_i-bar{X_n})^2

donde se ha tomado como denominador n-1, en lugar de n. A este parámetro también se le llama cuasivarianza.[47]

Véase también [editar]

Referencias [editar]

  1. Clapham, Christopher (septiembre de 1998). Diccionario de Matemáticas, Traducción: De Sá Madariaga, Juan Mª L, Primera edición, Oxford-Complutense, p. 266. ISBN 84-89784-56-6.
  2. «Parámetro estadístico». Enciclopedia Microsoft® Encarta® Online 2009. Microsoft Corporation (2009). Consultado el 19 de abril de 2009.
  3. Ross, Sheldon M. (2007). «3. Uso de la Estadística para sintetizar conjuntos de datos.», Introducción a la Estadística, trad. Valdés Sánchez, Teófilo, Reverte, p. 69. ISBN 8429150390. Consultado el 5-4-2009.
  4. Fernández Gordillo, Juan Carlos (2008). «Parámetros estadísticos». Ditutor, Diccionario de Matemáticas. Consultado el 19 de abril de 2009.
  5. Serret Moreno-Gil, Jaime (1998). «4. Parámetros Estadísticos», Procedimientos estadísticos. ESIC, p. 71. ISBN 8473561716. Consultado el 19-4-2009.
  6. Pascual, José; Galbiati, José; González, Gladys; Maulén, Mª Angélica; Arancibia, Rodrigo. «Conceptos básicos: Modelo», Exploración de datos: Introducción a la Estadística Descriptiva, Diseñadora: Galbiati, Paola, Instituto de Estadística. Universidad Católica de Valparaíso. Consultado el 16-4-2009.
  7. «Parámetro estadístico». Enciclopedia Microsoft® Encarta® Online 2009. Microsoft Corporation (2009). Consultado el 19 de abril de 2009. «Parámetro estadístico, número que se obtiene a partir de los datos de una distribución estadística y que sirve para sintetizar alguna característica relevante de la misma.»
  8. Clapham, Christopher (septiembre de 1998). Diccionario de Matemáticas, Traducción: De Sá Madariaga, Juan Mª L, Primera edición, Oxford-Complutense, p. 266. ISBN 84-89784-56-6. «Parámetro (en estadística): Cierta cantidad que caracteriza de alguna forma a la población, como su media o su mediana»
  9. Serret Moreno-Gil, Jaime (1998). «4. Parámetros Estadísticos», Procedimientos estadísticos. ESIC, p. 71. ISBN 8473561716. Consultado el 19/04/2009. «En estadística descriptiva tenemos una serie de expresiones (...) que permiten disponer de unos valores numéricos que reflejan el comportamiento global del suceso estadístico, calculados a partir de los datos individuales. Estas expresiones son los parámetros estadísticos»
  10. a b Huff, Darrel (1965). «2. El promedio bien escogido», Cómo mentir con estadísticas. Acapulco: Sagitario.
  11. «Citas de Benjamin Disraeli en Wikiquote». Consultado el 5 de abril de 2009.
  12. «Mentiras, grandes mentiras y estadísticas en la Wikipedia inglesa».
  13. Citas de Bernard Shaw
  14. Los Simpsons, temporada 5], episodio Homer, el vigilante
  15. citado por Calot (1985, pp. 55, 56) y MAD-Eduforma (2006, p. 160)
  16. Romero Villafranca, Rafael; Zúnica Ramajo, Luisa Rosa (2005). «2.6. Parámetros de posición», Métodos estadísticos en Ingeniería. Valencia: Univ. Politéc. Valencia, pp. 39-41. ISBN 8497057279. Consultado el 20 de abril de 2009.
  17. «Medidas de Dispersión». Enciclopedia Microsoft® Encarta® Online. Microsoft Corporation (2009). Consultado el 20 de abril de 2009.
  18. Serret Moreno-Gil, Jaime (1998). «4.3. Parámetros de forma.», Procedimientos estadísticos. ESIC, pp. 81. ISBN 8473561716. Consultado el 20-4-2009.
  19. Ello significa que si se registran edades, por ejemplo, la medida de posición correspondiente también es una edad, está medida en esas mismas unidades y podría ser igual a uno de los datos.
  20. Wackerly, Dennis D; Mendenhall, William; Scheaffer, Richard L. (2002). «1.3. Descripción de un conjunto de mediciones: métodos numéricos», Estadística matemática con aplicaciones, 6ª edición, Cengage Learning Editores, p. 8. ISBN 9706861947. «La medida central que más se usa en estadística es la media aritmética»
  21. Rius Díaz, Francisca (octubre de 1997). «2.3.2 La media», Bioestadística. Métodos y aplicaciones. Málaga: Universidad de Málaga. ISBN 84-7496-653-1. Consultado el 7-4-2009.
  22. Wackerly, Dennis D; Mendenhall, William; Scheaffer, Richard L. (2002). «1.3. Descripción de un conjunto de mediciones: métodos numéricos», Estadística matemática con aplicaciones, 6ª edición, Cengage Learning Editores, p. 8. ISBN 9706861947. «Dos conjuntos de mediciones podrían tener distribuciones de frecuencias muy distintas, pero con la misma media»
  23. Rius Díaz, Francisca. «2.3.6 La moda», Bioestadística. Métodos y aplicaciones.
  24. Santos, María José (abril de 2009) «Retrato robot del alcalde metropolitano» El Correo de Andalucía. Consultado el 7-4-2009.
  25. Serret Moreno-Gil, Jaime (1998). Procedimientos estadísticos. ESIC, pp. 75. ISBN 8473561716. Consultado el 17-4-2009.
  26. Rius Díaz, Francisca. «2.3.4 La mediana», Bioestadística. Métodos y aplicaciones.
  27. Martín Andrés, Antonio; Luna del Castillo, Juan de Dios (2004). Bioestadística para las ciencias de la Salud. Capitel Editores, p. 28. ISBN 8484510182. Consultado el 17-4-2009.
  28. Chaves, Bernardo (2004). «La media geométrica y la media armónica». Bioestadística para postgrado. Universidad Nacional de Colombia. Consultado el 7 de abril de 2009.
  29. Johnson, Robert; Kuby, Patricia (2003). «2.8. El arte del engaño estadístico», Estadística elemental, 3ª edición, Cengage Learning Editores, pp. 94. ISBN 9706862870.
  30. a b Rius Díaz, Francisca. «2.7. Medidas de variabilidad o dispersión», Bioestadística. Métodos y aplicaciones. Consultado el 17-4-2009.
  31. Férnandez Fernández, Santiago; Alejandro Córdoba, José María Cordero Sánchez, Alejandro Córdoba (2002). «4.2. Medidas absolutas», Estadística Descriptiva, 2ª edición, ESIC Editorial, p. 192. ISBN 8473563069.
  32. a b Rius Díaz, Francisca. «2.7.4. Varianza y desviación típica», Bioestadística. Métodos y aplicaciones. Consultado el 7-4-2009.
  33. Wackerly, Dennis D. «3.11. Teorema de Chebyshev», Estadística matemática con aplicaciones, p. 139.
  34. Férnandez Fernández, Santiago. «4.2.3.4. Meda o desviación mediana», Estadística Descriptiva, p. 200.
  35. Férnandez Fernández, Santiago. «4.3. Medidas relativas», Estadística Descriptiva, p. 201.
  36. Férnandez Fernández, Santiago. «4.3. Medidas relativas», Estadística Descriptiva, p. 202.
  37. Sotomayor Velasco, Gabriel; Wisniewski, Piotr Marian (2001). «8.7. Momentos y otras características», Probabilidad y estadística para ingeniería y ciencias. Cengage Learning Editores, p. 196. ISBN 970686136X. Consultado el 7-4-2009.
  38. a b Malléa, Adriana, Adriana; Herrera, Myriam; Ruiz, Ana María (2003). «3. Parámetros estadísticos no convencionales», Estadística en el nivel polimodal. San Juan: effha, p. 67. ISBN 9872084920. Consultado el 17-4-2009.
  39. Llorente Galera, Francisco; Staff, VV; Marín Feria, Susana; Torra Porras, Salvador (2000). «2.6. Medidas de concentración», Principios de estadística descriptiva aplicada a la empresa. Ramón Areces, pp. 53-54. ISBN 8480044276. Consultado el 17-4-2009.
  40. Wackerly, Dennis D. «3.9. Momentos y funciones generadoras de momentos», Estadística matemática con aplicaciones, p. 131.
  41. Casas Sánchez, J.M; Santos Peña, Julián (2002). «2.6. Momentos», Introducción a la estadística para economía, 2 edición, Ramón Areces, p. 95. ISBN 848004523X. «Si los momentos coinciden en dos distribuciones, diremos que son iguales»
  42. Cáceres Hernández, Juan José (2007). «4.1. Variable estadística multidimensional y distribución de frecuencias», Conceptos básicos de Estadística para Ciencias Sociales. Delta Publicaciones, p. 62. ISBN 8496477436.
  43. Arias Rodríguez, Jose Carlos (2004). «Distribuciones bidimensionales». Proyecto Descartes. Madrid: Ministerio de Educación, Política Social y Deporte. Consultado el 7 de abril de 2009.
  44. Rius Díaz, Francisca (octubre de 1997). «3.10.2. Una interpretación geométrica de la covarianza», Bioestadística. Métodos y aplicaciones. Málaga: Universidad de Málaga. ISBN 84-7496-653-1. Consultado el 7-4-2009.
  45. Barón López, Francisco Javier. «Bioestadística» (Vídeo en Flash). Málaga: Universidad de Málaga. Consultado el 18 de abril de 2009.
  46. Casas Sánchez, Jose M.; Manzano Arrondo, Vicente; Zamora Sanz, Ana Isabel; (1997). «2. Estimación puntual», Inferencia Estadística, 2ª, ilustrada edición, Ramón Areces, pp. 89-162. ISBN 848004263X. Consultado el 17-4-2009.
  47. Álvarez Leiva, Juan Antonio (diciembre de 1997). «Medidas de dispersión». Proyecto CICA Thales. Sociedad Andaluza de Educación Matemática "Thales". Consultado el 7-4-2009.

Bibliografía [editar]

Enlaces externos [editar]

Calculadoras de parámetros estadísticos:

  • Las tres medias Calcula la media aritmética, geométrica y armónica de una serie de 80 datos o menos.
  • La calculadora web descriptiva Calcula media, moda, varianza, desviación típica, coeficiente de variación, coeficientes de forma, índice Gini, media armónica.
  • Calculadora estadística Incluye parámetros bidimensionales y otros cálculos de utilidad en probabilidad.

Cursos completos de estadística descriptiva:

02/06/2010 10:54 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: EL ORDEN. Uno de los significados de orden es la propiedad que emerge en el momento en que varios sistemas abiertos, pero en origen aislados, llegan a interactuar por coincidencia en el espacio y el tiempo, produciendo, mediante sus interacciones naturales, una sinergia que ofrece como resultado una realimentación en el medio, de forma que los elementos usados como materia prima, dotan de capacidad de trabajo a otros sistemas en su estado de materia elaborada. La capacidad de algunos sistemas de recordar el pasado (de tener memoria), produce (en ese sistema) la capacidad de establecer un método organizado y coordinado para repetir el logro alcanzado por selección natural, y acelerar el objetivo a conseguir. En ese proceso, se paga un precio: la pérdida de su individualidad, mayor dependencia de nuevos elementos que pueden existir gracias a una economía más holgada, pero ganando en especialización. Bajo este enfoque, el orden es la organización de las partes para hacer algo funcional y preciso, lo cual implica la presencia de un cauce que establece una transacción de cargas con menor coste y por lo tanto con potencial de desarrollo a una psicodinámica emergente, dando la oportunidad al observador de imputar una finalidad intencional y, como puede deducirse, de una acción inteligente.

Orden

De Wikipedia, la enciclopedia libre

Para otros usos de este término, véase Orden (biología).

Uno de los significados de orden es la propiedad que emerge en el momento en que varios sistemas abiertos, pero en origen aislados, llegan a interactuar por coincidencia en el espacio y el tiempo, produciendo, mediante sus interacciones naturales, una sinergia que ofrece como resultado una realimentación en el medio, de forma que los elementos usados como materia prima, dotan de capacidad de trabajo a otros sistemas en su estado de materia elaborada.2

La capacidad de algunos sistemas de recordar el pasado (de tener memoria), produce (en ese sistema) la capacidad de establecer un método organizado y coordinado para repetir el logro alcanzado por selección natural, y acelerar el objetivo a conseguir. En ese proceso, se paga un precio: la pérdida de su individualidad, mayor dependencia de nuevos elementos que pueden existir gracias a una economía más holgada, pero ganando en especialización. Bajo este enfoque, el orden es la organización de las partes para hacer algo funcional y preciso, lo cual implica la presencia de un cauce que establece una transacción de cargas con menor coste y por lo tanto con potencial de desarrollo a una psicodinámica emergente, dando la oportunidad al observador de imputar una finalidad intencional y, como puede deducirse, de una acción inteligente.

Contenido

[ocultar]

Ámbitos de orden [editar]

En el ámbito del orden social, por ejemplo, el orden se remite a la forma en la cual las comunidades se organizan. Así, existen las sociedades jerárquicas, que se basan en una organización social rígida y piramidal, o en sus antípodas las sociedades anarquistas, cuyo orden es mucho más flexible y requiere, en consecuencia, fuertes valores de conducta, como el respeto por la libertad del otro, la igualdad y la responsabilidad por los actos propios. En las diferentes formas de organización social, los factores determinantes son la cultura y los fenómenos particulares que hacen a la naturaleza de cada una de ellas, y no necesariamente las leyes escritas, las cuales tan sólo reflejan las leyes sociales creadas por la comunidad, o alguna de sus partes.

Otros puntos de vista [editar]

Bajo otro punto de vista, el orden no es únicamente una acción inteligente, sino todo aquello que funciona de una determinada manera. Así, aunque quien observa el orden y en última instancia lo define es un individuo inteligente, el orden se encuentra naturalmente en la disposición de sucesos u otros conceptos observables. Aquello que denominamos tiempo, por ejemplo, presenta un orden natural para los sucesos y, guiados al menos por los conocimientos concretos del ser humano hasta el día de hoy, el orden cronológico es unidireccional e invariable.

Los antonimos de orden pueden ser, según el contexto en que sea utilizado, desorganización, desorden y caos.

De la misma forma, existen órdenes de órdenes, que solemos llamar estructuras. Existen multitud de estructuras en los más diversos campos tanto de la naturaleza como de la vida social.

Utilizado en femenino, una orden es un imperativo.

Criterios de ordenación [editar]

Significados en diferentes ciencias [editar]

Significados matemáticos [editar]

Teoría de conjuntos [editar]

Algoritmos [editar]

Otros usos [editar]

Significados sociales [editar]

Hay gran número de honores y condecoraciones en gran número de países que llevan el nombre de Orden de....

Orden como imperativo [editar]

Una orden es una instrucción que se debe cumplir imperativamente.

Orden en el ejército [editar]

En el ejército y la guerra, orden (ejército) es un mandato imperativo:

Orden en el cristianismo [editar]

Obras artísticas y literarias [editar]

Nombres de lugares (topónimos) [editar]

Agrupaciones políticas [editar]

Véase también [editar]


14/05/2010 18:25 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: TEORÍA DEL ORDEN. SIGNO + O -, ESTA TODO DESORDENADO: ¿CÓMO SE ORDENA? EL SUPERIOR SUBORDINADO AL INFERIOR? SIGNOS ( . + - X) LOS CUATRO ELEMENTOS MÁS EL QUINTO (LA QUINTAESENCIA). ¿LA NATURALEZA ES LO MÁS PURO? ¿ES LO MÁS COTIZADO? ¿TIENE UN PRECIO MUY ALTO? SU VALOR PECUNIARIO, LO SABIDO, ADMITIDO COMUNMENTE, LO AUTORIZADO POR EL USO O LA COSTUMBRE, EL MOVIMIENTO DE LAS AGUAS, LO DETERMINADO, EL MOVIMIENTO, EL AGUA, LA SATÍRICA, EL ORO Y LA LUZ (LA ILUSTRACIÓN, LA CULTURA) QUE HACE QUE BRILLE TODO LO BUENO... La teoría del orden es una rama de la matemática que estudia varias clases de relaciones binarias que capturan la noción intuitiva del orden matemático. Este artículo da una introducción detallada a este campo e incluye algunas de las definiciones más básicas. Para una rápida búsqueda de un término orden teórico, hay también un glosario de teoría del orden. Una lista de asuntos sobre orden recoge los artículos que existen en relación a esta teoría del orden.

Teoría del orden

De Wikipedia, la enciclopedia libre

La teoría del orden es una rama de la matemática que estudia varias clases de relaciones binarias que capturan la noción intuitiva del orden matemático. Este artículo da una introducción detallada a este campo e incluye algunas de las definiciones más básicas. Para una rápida búsqueda de un término orden teórico, hay también un glosario de teoría del orden. Una lista de asuntos sobre orden recoge los artículos que existen en relación a esta teoría del orden.

Contenido

[ocultar]

Trasfondo y motivación [editar]

El orden aparece por todas partes - por lo menos, si se trata de matemática y áreas relacionadas tales como la informática. El primer orden que uno típicamente encuentra en la educación matemática de la escuela primaria es el orden ≤ de los números naturales. Este concepto intuitivo es fácilmente extendido a otros conjuntos de números, tal como los enteros y reales. De hecho la idea de ser mayor o menor que otro número es una de las intuiciones básicas de los sistemas de numeración en general (que uno generalmente se interesa también en la diferencia real de dos números, que no viene dada por el orden). Otro ejemplo popular de un orden es el orden lexicográfico de las palabras en un diccionario.

Los tipos antedichos de orden tienen una propiedad especial: cada elemento se puede comparar con cualquier otro elemento, es decir es o mayor, o menor, o igual. Sin embargo, esto no siempre es un requisito deseable. Un ejemplo bien conocido es el orden de los subconjuntos de un conjunto. Si un conjunto contiene los elementos de cierto otro conjunto, entonces se puede decir que es menor o igual. Con todo, hay conjuntos que pueden no ser comparables de este modo, puesto que cada uno puede contener algún elemento que no esté presente en el otro. Por lo tanto, inclusión de subconjuntos es un orden parcial, en comparación con los órdenes totales dados antes.

Alentadas por los amplios usos prácticos de los órdenes, se pueden definir numerosas clases especiales de conjuntos ordenados, algunas de las cuales han llegado a ser campos matemáticos por sí mismos. Además, la teoría del orden no se restringe a las varias clases de relaciones de orden, sino que también considera funciones apropiadas entre ellas. Un ejemplo simple de una propiedad orden teórica viene del análisis donde encontramos con frecuencia a las funciones monótonas.

Introducción a las definiciones básicas [editar]

Esta sección tiene como objetivo dar una primera guía al reino de los conjuntos ordenados. Está dirigida al lector que tiene un conocimiento básico teoría de conjuntos y aritmética y que sabe qué es una relación binaria, pero que no está familiarizado, hasta ahora, con consideraciones teóricas sobre orden.

Conjuntos parcialmente ordenados [editar]

Como ya se hizo alusión arriba, un orden es una relación binaria especial. Por lo tanto consideremos algún conjunto P y una relación binaria ≤ en P. Entonces ≤ es un orden parcial si es reflexiva, antisimétrica, y transitiva, es decir, para todo a, b y c en P, tenemos que:

aa (reflexividad) si ab y bc entonces ac (transitividad) si ab y ba entonces a = b, (antisimetría).

Un conjunto con un orden parcial se llama conjunto parcialmente ordenado, o, en breve, poset (del inglés partially ordered set). El término conjunto ordenado a veces también se utiliza para los posets, mientras esté claro del contexto que no se quiere significar ninguna otra clase de órdenes. Comprobando esta propiedad, se ve inmediatamente que los bien conocidos órdenes de los naturales, enteros, racionales y reales son todos órdenes en el antedicho sentido. Sin embargo, tienen la propiedad adicional de ser total, es decir, para todo a, b en X

ab o ba (totalidad)

este orden se puede también llamar orden lineal o cadena. mientras que muchos órdenes clásicos son lineales, el orden entre subconjuntos de un conjunto proporciona un ejemplo donde éste no es el caso. De hecho, muchas propiedades avanzadas de los posets son interesantes principalmente para un orden no lineal.

Visualizando órdenes [editar]

Antes de proceder con más ejemplos y definiciones, será provechoso poder exhibir un orden de una manera gráfica conveniente, para proporcionar un "cuadro" que uno pueda tener en mente (o en papel) cuando se intente acceder a conceptos más abstractos. Para este propósito se han introducidos los, así llamados, diagramas de Hasse. Estos son grafos donde los vértices son los elementos del poset y la relación de orden está indicada por las aristas y la posición relativa de los vértices. Los órdenes se dibujan de abajo hacia arriba: si un elemento x es menor que y entonces existe una trayectoria de x hasta y que se dirige hacia arriba. A menudo es necesario que la conexión entre puntos se intersequen, pero los puntos nunca deben ser situados en conexión directa entre otros dos puntos.

Aún los conjuntos infinitos pueden a veces ser ilustrados por diagramas similares, usando puntos suspensivos (...) después de dibujar un suborden finito que sea lo suficientemente instructivo. Esto funciona bien para los números naturales, pero falla para los reales, donde no existe el inmediato sucesor. Sin embargo, frecuentemente se obtiene una intuición relacionada con diagramas de este tipo.

Todos los órdenes antedichos son muy comunes en matemática, sin embargo hay también ejemplos que uno no considera a menudo como órdenes. Por ejemplo, la relación de identidad "=" en un conjunto es un orden parcial. Dentro de este orden, cualesquiera dos (i.e. distintos) elementos son incomparables. Es también la única relación que es un orden parcial y una relación de equivalencia. El diagrama de Hasse de tal orden discreto es solamente una colección de puntos etiquetados, sin ninguna arista entre ellos.

Otro ejemplo viene dado por la relación de divisibilidad "|". Para dos números naturales n y m, escribimos n|m si n divide a m sin resto. Uno ve fácilmente que esto da realmente un orden parcial. Un ejercicio instructivo es dibujar el diagrama de Hasse para el conjunto de los números naturales que son menores o iguales que, digamos, 13, ordenados por |.

Elementos especiales dentro de un orden [editar]

En un conjunto parcialmente ordenado hay algunos elementos que desempeñan un papel especial. El ejemplo más básico está dado por el mínimo de un poset. Por ejemplo, 0 es el mínimo de los números naturales y el conjunto vacío es el mínimo bajo el orden de subconjuntos. Formalmente, esto se puede describir por la propiedad:

0 ≤ a, para todo elemento a del conjunto ordenado.

Es frecuente encontrar la notación 0 para el mínimo, incluso cuando no se refiera a números. Sin embargo, en un orden de un conjunto numérico, esta notación puede ser inadecuada o ambigua, puesto que el número 0 no siempre es el mínimo. Un ejemplo es el antedicho orden de divisibilidad |, donde 1 es el mínimo puesto que divide a todo el resto de números. Por otra parte, 0 es un número que se divide por todo el resto de números. ¡Por lo tanto es el máximo del orden! Otros términos frecuentes para estos elementos son fondo y tapa o cero y uno. Pueden no existir los elementos "mínimo" o "máximo", como demuestra el ejemplo de los números reales. Por otra parte, si existen son siempre únicos. En contraste, consideremos la relación de divisibilidad | en el conjunto {2, 3, 4, 5, 6}. Aunque este conjunto no tiene ni tapa ni fondo, los elementos 2, 3, y 5 no tienen ningún elemento debajo, mientras que 4, 5, y 6 no tienen ninguno otro número arriba. Tales elementos se llaman minimales y maximales, respectivamente. Formalmente, un elemento m es minimal si:

am implica a = m, para todo elemento a.

Intercambiando ≤ con ≥ obtenemos la definición de maximal. Como el ejemplo demuestra, puede haber muchos elementos minimales o maximales y algún elemento puede ser maximal y minimal (e.g. 5 arriba). Sin embargo, si hay un elemento mínimo, entonces es el único elemento minimal del orden. (Si se sigue estrictamente la definición dada. Lamentablemente hay una tradición matemática "a contrario": considerar los minimales y maximales en el conjunto despojado de su máximo y su mínimo, si los hubiere. Esto debe recordarse. N.T.). Una vez más, en los posets no siempre hay infinitos elementos maximales - el conjunto de todos los subconjuntos finitos en un conjunto infinito dado, ordenado por inclusión de subconjuntos, proporciona uno, entre muchos, contraejemplo. Una herramienta importante para asegurar la existencia de elementos maximales bajo ciertas condiciones es el Lema de Zorn.

Los subconjuntos de un conjunto parcialmente ordenado heredan el orden. Ya aplicamos esto al considerar el subconjunto {2, 3, 4, 5, 6} de los números naturales con el orden de divisibilidad inducido. Hay también elementos de un poset que son especiales con respecto a cierto subconjunto del orden. Esto conduce a la definición de cota superior. Dado un subconjunto S de cierto poset P, una cota superior de S es un elemento b de P que está sobre todo elemento de S. Formalmente, esto significa que

sb, para todo s en S.

Cota inferior se define invirtiendo el orden. Por ejemplo, -5 es una cota inferior de los números naturales como subconjunto de los enteros. Dado un conjunto de conjuntos , una cota superior para éstos conjuntos viene dado por su unión. De hecho, esta cota superior es muy especial: es el más pequeño conjunto que contiene todos los conjuntos dados. Por lo tanto, encontramos la menor cota superior de un conjunto de conjuntos. Este concepto se llama también supremo y para un conjunto S se escribe sup S o VS para su menor cota superior. Inversamente, la mayor cota inferior se la conoce como ínfimo y se denota inf S o ^S. Este concepto desempeña un papel importante en muchos usos de la teoría del orden. Para dos elementos x y y, uno también escribe x v y y x ^ y para sup{x, y} e inf{x, y}, respectivamente.

Usando Wikipedia TeX markup, uno puede también escribir vee y wedge, así como símbolos grandes bigvee y bigwedge. Observe, sin embargo, que todos esos símbolos pueden no tener símbolo de tamaño correspondiente al de la fuente del texto estándar y, por tanto, se prefiere utilizarlos en líneas adicionales. Muchos de los navegadores de hoy son incapaces de representar ∨ para v y ∧ para ^ en algunas plataformas, y por lo tanto se evita aquí.

Considere otro ejemplo en la relación | para los números naturales. La menor cota superior de dos números es el menor número que es múltiplo de ambos, es decir el mínimo común múltiplo. Mayor cota inferior es, alternativamente, el máximo común divisor.

Dualidad [editar]

En las anteriores definiciones, a menudo, observamos que un concepto puede ser definido por invertir simplemente el orden en una definición anterior. Este es el caso para "menor" y "mayor", para "mínimo" y "máximo", para "cota superior " y "cota inferior", etcétera. Esto es una situación general en teoría de orden: Un orden dado se puede invertir con solamente intercambiar su dirección, pictóricamente dar vuelta el diagrama de Hasse de arriba para abajo. Esto da el, así llamado, orden dual, inverso u opuesto.

Cada definición orden teórica tiene su dual: es la noción que se obtiene al aplicar la definición al orden inverso. Dada la simetría de todos los conceptos, esta operación preserva los teoremas del orden parcial. Para un resultado matemático dado, se puede, simplemente, invertir el orden y substituir todo definición por su dual y obtener otro teorema válido. Esto es importante y útil, puesto que uno obtiene dos teoremas al precio de uno. Más detalle y ejemplos se pueden encontrar en el artículo sobre dualidad en teoría de orden.

Construyendo nuevos órdenes [editar]

Hay muchas maneras de construir órdenes, o para combinar órdenes en uno nuevo. El orden dual es un primer ejemplo. Otra importante construcción es el producto cartesiano de dos conjuntos parcialmente ordenados, junto con el orden producto en pares de elementos. Esto se define por los órdenes originales haciendo (a, x) ≤ (b, y) si ab y xy. La unión disjunta de dos posets es otra típica construcción, donde el orden es exactamente la unión de los órdenes originales.

Como en el caso del orden usual de números, cada orden parcial ≤ da lugar a un orden estricto <, al definir a < b si ab y no ba. Esta transformación puede ser invertida haciendo ab si a < b o a = b.

Funciones entre órdenes [editar]

Es razonable requerir que las funciones entre conjuntos parcialmente ordenados tengan ciertas propiedades adicionales, que se relacionen con la relación de orden de los dos conjuntos. La condición más fundamental que se presenta en este contexto es la monotonía. Un función f de un poset P a un poset Q es monótona u orden preservante, si ab en P implica f(a) ≤ f(b) en Q. La conversa de esta implicación conduce a una función que es orden reflectante, es decir una función f como arriba para la cuál f(a) ≤ f(b) implica ab. Por otra parte, una función puede también ser orden inversora o antítona, si ab implica f(a) ≥ f(b).

Una inmersión de orden es una función f entre órdenes que es orden preservante y orden reflectante. Ejemplos para esta definición se encuentran fácilmente. Por ejemplo, función que mapea un número natural en su sucesor es claramente monótona con respecto al orden natural. Cualquier función de un orden discreto, es decir un conjunto ordenado por el orden identidad "=", es también monótono. Mapear cada número natural al correspondiente número real da un ejemplo para una inmersión de orden. El complemento conjuntista en un conjunto de partes es un ejemplo de una función antítona.

Una importante pregunta es cuándo dos órdenes son "esencialmente iguales", es decir cuándo son lo mismo salvo retitular elementos. Un isomorfismo de orden es una función que define tal renombrar. Un isomorfismo de orden es una función monótona biyectiva que tiene una inversa monótona. Esto es equivalente a una inmersión de orden sobreyectiva. Por lo tanto, la imagen f(P) de una inmersión de orden es siempre isomorfa a P, lo que justifica el término "inmersión".

Un más elaborado tipo de función es la, así llamada, conexión de Galois. Conexiones de Galois monótonas pueden ser vistas como una generalización de los isomorfismos de orden, puesto que están constituidas por dos funciones en inversa dirección, que no son inversas absolutas una de la otra, pero tienen cercana relación.

Otro tipo especial de endofunción en un poset es el operador de clausura, que no solamente es monotónico, sino también idempotente, es decir. f(x) = f(f(x)), y extensivo, es decir. xf(x). éste tiene mucho uso en todo clase de "clausuras" que aparecen en matemática.

Además de compatible con la mera relación de orden, una función entre posets puede también comportarse bien con respecto a elementos especiales y construcciones. Por ejemplo, cuando se habla de posets con menor elemento, parece razonable considerar solamente una función monotónica que preserve este elemento, es decir que mapee menor elemento en menor elemento. Si el ínfimo binario ^ existe, entonces una propiedad razonable puede ser requerir que f(x^y) = f(x) ^ f(y), para todo x y y. Todas estas propiedades, y de hecho muchas más, pueden ser agrupadas bajo la etiqueta función que preserva límite.

Finalmente, uno puede invertir la visión, cambiar funciones de orden a orden de funciones. De hecho, las funciones entre dos posets P y Q pueden ser ordenadas vía el orden punto a punto. Para dos funciones f y g, se tiene fg si f(x) ≤ g(x) para todo elemento x en P. Esto ocurrirá por ejemplo en teoría de dominios, donde los espacios funcionales desempeñan un importante papel.

Tipos especiales de orden [editar]

Muchas de las estructuras que son estudiadas en teoría de orden emplean relación de orden con propiedades adicionales. De hecho, algunas relaciones que no son de orden parcial son de especial interés. Principalmente, el concepto de un preorden tiene que ser mencionado. Un preorden es unoarelación que esreflexiva y transitiva, pero no necesariamente antisimétrica. Cada preorden induce una relación de equivalencia entre elementos, donde a es equivalente a b, si ab y ab. Los preórdenes pueden ser convertidos en órdenes identificando todo elemento equivalente con respecto a esta relación.

Tipos básicos de órdenes especiales ya se dieron en forma de orden total. Una simple pero útil propiedad adicional conduce al, así llamado, buen orden, dentro del que todo subconjunto no vacío tiene un menor elemento (también denominado primer elemento). Muchos otros tipos de orden se presentan cuando se garantiza la existencia de ínfimos y supremos de ciertos conjuntos. Centrándose en este aspecto, generalmente referido como completitud de órdenes, se obtiene:

  • Posets acotados, es decir posets con menor y mayor elementos (que son precisamente supremo e ínfimo del conjunto vacío),
  • reticulados, en que cada conjunto finito no vacío tiene supremo e ínfimo,

Sin embargo, uno puede ir incluso más allá: si todo ínfimo finito no vacío existe, entonces ^ puede ser visto como una operación binaria total en el sentido del álgebra universal. Por lo tanto, en un reticulado, dos operaciones ^ y v están disponibles, y se puede definir nuevas propiedades dando identidades, tal como

x ^ (y v z) = (x ^ y) v (x ^ z), para todo x, y, y z.

Este condición se llama distributividad y dar lugar a los reticulados distributivos. Hay algunas otras importantes leyes de distributividad que son discutidas en el artículo sobre la distributividad en teorías de orden. Algunas estructuras de orden adicionales que son a menudo especificadas vía operación algebraica y definiendo identidades son

en que ambas introducen una nueva operación ~ llamada negación. Ambas estructuras desempeñan un papel en lógica matemática y especialmente las álgebras de Boole tienen importante uso en informática. Finalmente, varias estructuras en matemática combinan orden con operaciones aún más algebraicas, como el caso de quantales, que permite la definición de una operación de adición.

Existen muchas otras importantes propiedades de los posets. Por ejemplo, un poset es localmente finito si cada intervalo cerrado [a, b] en él es finito. Los posets localmente finitos dan lugar a álgebras de incidencia que alternadamente pueden ser utilizadas para definir característica de Euler de posets finitos acotados.

Subconjuntos de conjuntos ordenados [editar]

En un conjunto ordenado, uno puede definir muchos tipos especiales de subconjuntos basados en el orden dado. Un ejemplo simple son los conjuntos superiores, es decir conjuntos que contienen todo elemento que esté sobre ellos en el orden. Formalmente, la clausura superior de un conjunto S en un poset P viene dado por el conjunto {x en P| hay algún y en S con yx}. Un conjunto que es igual a su clausura superior se llama un conjunto superior. conjunto inferior es definido dualmente.

Subconjuntos inferiores más complicados son los ideales, que tienen la propiedad adicional que cada dos de sus elementos tiene cota superior dentro del ideal. Su noción dual son los filtros. Un concepto relacionado es el de subconjunto dirigido, que como un ideal contiene cota superior de un subconjunto finito, pero no tiene porque ser un conjunto inferior. Además, a menudo se generaliza a conjuntos preordenados.

Un subconjunto que es - como sub-poset - linealmente ordenado, se llama una cadena. La noción opuesta, anticadena, es un subconjunto que no contiene ningún par de elementos comparables, es decir que es un orden discreto.

Áreas matemáticas relacionadas [editar]

aunque la mayoría de las áreas matemáticas usan orden de uno u otra manera, también hay algunas teorías que tienen una relación que va mucho más allá de la mera utilización. Junto con su importante punto de contacto con la teoría de orden, algunas serán presentadas abajo.

Álgebra universal [editar]

Según lo ya mencionado, los métodos y el formalismo del álgebra universal son una herramienta importante para muchas consideraciones orden teóricas. Aparte de formalizar órdenes en términos de estructuras algebraicas que satisfacen ciertas identidades, se pueden también establecer otras conexiones con el álgebra. Un ejemplo es la correspondencia entre las álgebras de Boole y los anillos de Boole. Otros aspectos tienen que ver con la existencia de construcciones libres, tal como los reticulados libres basados en un conjunto de generadores. Además, los operadores de clausura son importantes en el estudio del álgebra universal.

Topología [editar]

En topología el orden desempeña un muy prominente papel. De hecho, el conjunto de los abiertos proporciona un clásico ejemplo de un reticulado completo, más exactamente un álgebra de Heyting completa (o "marco" o "locale"). Los filtros y las redes son nociones relacionadas con la teoría de orden y el operador clausura conjuntista puede ser utilizado para definir una topología. Más allá de esta relación, la topología de puede mirar únicamente en términos del reticulado de conjuntos abiertos, que conduce al estudio de la topología sin puntos. Además, un preorden natural de elementos del conjunto subyacente de una topología viene dada por el, así llamado, orden de especialización, que es realmente un orden parcial si la topología es T0.

Inversamente, en teoría de orden, uno a menudo hace uso de resultados topológicos. Hay varias maneras de definir subconjuntos de un orden que pueden ser considerados como conjunto abiertos de una topología. Especialmente, es interesante considerar topologías en un poset (X, ≤) que reobtiene ≤ como su orden de especialización. La más fina de tales topologías es la topología de Alexandrov, dada al tomar todos los conjuntos superiores ("upper") como abiertos. Inversamente, la más gruesa topología que induce el orden de especialización es la topología superior, que tiene los complementos de los ideales principales (es decir conjuntos de la forma { y en X|yx} para cada x) como una subbase. Adicionalmente, una topología con orden de especialización ≤ puede ser orden consistente, significando que sus conjuntos abiertos son "inaccesibles por supremos dirigidos" (con respecto ≤). La topología más fina de un orden consistente es la topología de Scott, que es más gruesa que la topología de Alexandrov. Una tercera topología importante en esta línea es la topología de Lawson. Hay cercanas conexiones entre estas topologías y los conceptos de la teoría de orden. Por ejemplo, una función preserva supremos dirigidos si y sólo si es continuo con respecto a la topología de Scott (por este razón esta propiedad orden teórica es también llamada continuidad de Scott).

Teoría de categorías [editar]

La visualización de órdenes con diagramas de Hasse tiene una generalización directa: en vez exhibir elemento menores bajo los mayores, la dirección del orden se puede también representar dando la dirección de las aristas del grafo. De esta manera, cada orden se ve como equivalente a un grafo dirigido acíclico, donde los nodos son los elementos del poset y hay una trayectoria dirigida de a a b si y solamente si ab. Eliminando el requisito acíclico, uno puede también obtener todos los preórdenes.

Cuando es equipado con todas las aristas transitivas, estos grafos son solamente categorías especiales, donde los elementos son los objetos y cada conjunto de morfismos entre dos elementos es a lo sumo un singletón. Funciones entre órdenes se convierten en funtores entre categorías. Interesantemente, muchas ideas de la teoría de orden son simplemente pequeñas versiones de los conceptos de la teoría de las categorías. Por ejemplo, un ínfimo es precisamente un producto categórico. Más en general, uno puede subsumir supremos e ínfimos bajo la noción abstracta de un límite categórico (o colímite, respectivamente). Otro lugar en donde las ideas categoriales surgen es el concepto de una conexión de Galois (monótona), que es precisamente igual a un par de funtores adjuntos.

Pero la teoría de las categorías también tiene un impacto en la teoría de orden de mayor escala. Clases de posets con funciones apropiadas según lo discutido arriba forman interesantes categorías. A menudo uno puede también establecer construcción de órdenes, como el orden producto, en término de categoría. Otras intuiciones resultan cuando categorías de orden resultan equivalentes categóricas a otra categoría, por ejemplo de espacios topológicos. Este línea de investigación conduce a varios teoremas de representación, a menudo recogidos bajo la etiqueta dualidad de Stone.

Esquema de temas relacionados [editar]

Teoría del orden
Bien ordenado
Orden total
Parcialmente ordenado
Preordenado
Relación reflexiva
Relación transitiva
Relación antisimétrica
Relación total
Orden bien fundamentado

Referencias [editar]

  • G. Gierz, K. H. Hofmann, K. Keimel, J. D. Lawson, M. Mislove, and D. S. Scott, Continuous Lattices and Domains, In Encyclopedia of Mathematics and its Applications, Vol. 93, Cambridge University Press, 2003. ISBN 0-521-80338-1
14/05/2010 18:10 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS, FILOSOFÍA: CAUSAS DE LAS COSAS. PREGUNTAS CAUSALES: ¿HACE USTED LO QUE LE APETECE? ¿ASPIRA CON VEHEMENCIA AL CONOCIMIENTO O DISFRUTE DE UNA COSA? ¿CUÁL ES LA CAUSA DE SUS MALES? CAUSA, PRINCIPIO Y UNO, EXPRESIONES (¡FAINO! DEL GALLEGO) EXPRESIONES CAUSALES: ¿QUE PASÓ? ¿QUÉ ES LO QUE NO LE GUSTA? ¿LE GUSTA CONFUNDIR? ¿POR QUÉ? LES GUSTA SABER QUE SE DESEA Y HACER LO CONTRARIO, ¿LE GUSTA LA CAUSALIDAD? La causalidad en filosofía parte del hecho de que todo suceso se origina por una causa, origen o principio.

Causa

De Wikipedia, la enciclopedia libre

(...)

Para otros usos de este término, véase Causa (desambiguación).

Dados dos eventos A y B, A es causa de B si se cumplen una serie de condiciones lógicas, dos sucesos importantes.

  • La ocurrencia de A va acompañada de la ocurrencia de B, o si examinamos, representamos numéricamente el grado en que ocurren A y B, entonces encontramos una correlación positiva entre ambas variables.
  • La no-ocurrencia de B implica que tampoco podrá hallarse la ocurrencia de A, aunque la ocurrencia de B no tiene por qué estar ligada necesariamente a la concurrencia de A.

Cuando dos eventos A y B cumplen las dos condiciones anteriores decimos que existe una relación causal entre ambos: en concreto "A es causa de B" o equivalentemente "B es un efecto de A".

La idea de causa intuitivamente surge del intento de explicarnos lo que ocurre a nuestro alrededor mediante un determinado esquema lógico subyacente que nos permite relacionar unas cosas con otras mediante conexiones necesarias. Esta capacidad para establecer conexiones causales es una habilidad cognitiva básica de primates superiores, algunos mamíferos superiores e incluso algunos invertebrados como el pulpo de mar.

Esta habilidad cognitiva básica es importante precisamente porque existe cierta evidencia empírica de que que siempre que se dan las mismas circunstancias como causas, se producirá siempre el mismo efecto. Eso es lo que entendemos por principio de causalidad que según puede formular de un modo un tanto naïf como "todo lo que sucede en el mundo, en la Naturaleza tiene una causa" (también se suele parafrasear una proposición de Aristóteles: "Todo lo que se mueve, se mueve por otro").


Contenido

[ocultar]

Causa en Ciencias naturales y Ciencias sociales [editar]

La idea de causa aparece en ciencias naturales y sociales en varios contextos:

  1. En física donde el término suele denominarse causalidad, en mecánica newtoniana se admite además que la causa precede siempre al efecto.
  2. En estadística donde es analizado por la estadística inferencial.
  3. En ciencias sociales el concepto suele aparecer ligado a un análisis estadístico de variables observadas (por tanto en general se trata del mismo concepto manejado en el contexto 2).
  4. En ciencias naturales diferentes de la física y en procesos en los que no podemos reducir la concurrencia de eventos a un mecanimos físico simple (caso 1), la idea de causa aparece en procesos complejos entre los que hemos observado una relación causal. Así tras las ecuaciones empíricas se supone hay un proceso físico causal que lleva a una conexión necesaria entre ciertos eventos.

Causa en filosofía [editar]

La idea de "causa" ha suscitado un buen número de debates filosóficos, desde los primeros intentos filosóficos. Aristóteles concluye el libro de los Segundos analiticos con el modo en que la mente humana llega a conocer las verdades básicas o premisas primarias o primeros principios, que no son innatos, ya que es posible desconocerlos durante gran parte de nuestra vida. Tampoco pueden deducirse a partir de ningún conocimiento anterior, o no serían primeros principios. Afirma que los primeros principios se derivan por inducción, de la percepción sensorial, que implanta los verdaderos universales en la mente humana. De esta idea proviene la máxima escolástica "nada hay en el intelecto que no haya estado antes en los sentidos" (Nihil est in intellectu, quod prius non fuerit in sensu). Al mantener que "conocer la naturaleza de una cosa es conocer, ¿por qué es?" y que "poseemos conocimiento científico de una cosa sólo cuando conocemos su causa".

Aristóteles postuló cuatro tipos mayores de causa como los términos medios más buscados de demostración: la forma definible; un antecedente que necesita un consecuente; la causa eficiente; la causa final.[1]

En la filosofía occidental, el concepto de causa como "conexión necesaria" fue criticado por el filósofo David Hume.

En las relaciones causales encontramos que:

  • Observamos que las cosas no están aisladas, sino que unas están ligadas a otras en un proceso de interacción. Unas cosas suceden a otras, y siempre en el mismo orden.
  • Un conjunto de hechos definen una situación, y a este momento siempre le sucede otra situación y siempre la misma.
  • Al primer conjunto que define la situación lo llamamos causa, y a la segunda situación la llamamos efecto.
  • La ley de la causalidad no debe confundirse con el Principio de razón suficiente. De la confusión de ambos se ha seguido tradicionalmente la demostración de la existencia de Dios a partir del principio de causalidad. Tal paso es ilegítimo, como bien establecido está en el pensamiento científico y filosófico.
  • Sin embargo la ley de la causalidad es el esquema fundamental de la investigación científica, suponiendo que la mejor forma de comprender y explicar es conocer las causas, porque por un lado podemos prevenir y por otro controlar los efectos, en definitiva dominar los sucesos naturales.

***La palabra efecto, proviene del latín effectus y tiene una gran cantidad de significados, ligados muchos de ellos a la experimentación científica, porque su significado principal indica que efecto es aquello que se consigue por virtud de una causa o el fin para que se hace una cosa. La relación que existe entre causa y efecto se llama causalidad. La causalidad es objeto de profundos análisis en el campo filosófico.

Referencias [editar]

  1. Vulgarmente causa material, causa formal, causa eficiente y causa final

Véase también [editar]

14/05/2010 17:56 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: REDUCCIÓN AL ABSURDO. Reducción al absurdo (del latín Reductio ad absurdum) es un método de demostración (formalizado y a menudo usado por Aristóteles como un argumento lógico) en el que suponemos una hipótesis y obtenemos un resultado absurdo, por lo que concluimos que la hipótesis de partida ha de ser falsa. Este método es también conocido como prueba por contradicción o prueba ad absurdum. Parte de la base es el cumplimiento de la ley de exclusión de intermedios: una afirmación que no puede ser falsa, ha de ser consecuentemente verdadera.

Reducción al absurdo

De Wikipedia, la enciclopedia libre

HISTORIA DE LA BANDERA ANARQUISTA

HISTORIA DE LA BANDERA NEGRA DEL ANARQUISMO.

Bandera es un pedazo de textil usado como la insignia de un país o asociación. Con el pasar de los siglos, las corporaciones, clubes, entidades religiosas, militares, políticas y naciones empezaron a tener sus pabellones con los dibujos y colores previamente resueltos. Las uniones obreras también debatieron sus emblemas, aceptando en las asambleas sus banderas para producir una representación más grande de la clase.

Los anarquistas nunca se dieron al trabajo de discutir en congreso y aprobar su "Pabellón", los colores mas apropiados para expresar su filosofía de vida.

Así como la palabra Anarquía adoptada por Proudhon, ya se uso por el siglo XIII (el rey Philipe de Bel la usaba para llamar a los desobedientes que se opusieron a el) la bandera negra de los anarquistas también ya había sido usada para demostrar el disgusto, la tristeza, la revuelta, el procedimiento de los políticos Parisinos.

Izada por primera vez en la cima de la Cámara de Paris, en Julio de 1830 (las personas con la bandera negra) ellos deseaban expresar su rechazo al capitalismo, a los políticos, al Estado.

El eco producido era inmediato y los albañiles de Reims escribieron en este emblema "trabajo o muerte".

El año siguiente, los Cannuts (obreros del textil) de Lyon, protestaron contra los patrones que solo les pagaban 20 patacos por 16 horas de trabajo, en estado de revuelta ellos extendieron la bandera negra con el emblema "vivir trabajando o morir combatiendo". El 21 de Noviembre del mismo año los teclones volvieron a las calles de Lyon y fueron masacrados, pero no se asustaron, al contrario, incluyeron en la bandera un cráneo.

En la insurrección de Dresde, Bakunin asió la bandera negra, y Louise Michel, en Clamart.

En el año 1871, los comunistas usaron la bandera roja durante la revolución que dio origen a la Comuna de Paris, pero Jules Valtes propuso que se cambiase por la bandera negra, por ser "más radical y triste". Louise Michel apoyo y alguna vez defendió la idea de la bandera negra, y en 1882 haciendo los discursos en el primer cumpleaños de la Comuna dijo: "¡No mas banderas rojas pintadas en la sangre de nuestros soldados! Yo ondeare la bandera negra que toma el luto de nuestros muertos y nuestros dolores."

Louise Michel fue quien mas influencio la adopción de este emblema, enrollando la bandera negra en su cuerpo.

Pero fue en 1883 cuando Francia vivió la intensa agitación, fue que el anarquismo adopto la bandera negra definitivamente.

Ya, por nuestro siglo, o más exactamente, en el curso de la revolución rusa de 1917, Néstor Makhno, anarquista y revolucionario ucraniano con un combativo ejército popular también llevo la bandera negra con un cráneo.

En los años de 1918 a 1922, Makhno y sus compañeros asieron la misma bandera en defensa de las comunas libertarias ucranianas, destruidas por el ejército rojo, ordenado desde Moscú por Trotzky y Lenin, los sepultureros de la revolución junto a Zinoviev y Stalin.

Casi dos décadas después en la revolución social española, las diferentes Comunas libertarias entre ellas la de Durruti, asiaron la bandera negra con el pabellón anarquista.

Pero la bandera negra produjo el impacto más grande cuando se ondeo en mayo de 1968, en Paris, sobre las barricadas de adoquines levantadas para enfrentarse al poder y al gobierno.

Hace más de un siglo que la bandera negra ondeo por primera vez en la Torre de la Cámara de Paris, exactamente cuando el mundo intelectual, revolucionario y obrero regresaron sus miradas nuevamente a la capital de Francia. Una vez más Paris fue la sede de una gran convulsión social, con la bandera negra como pabellón. Más de 35 años nos separan del Mayo Francés y la bandera negra ondea desafiante a todo poder y opresión, de Paris a Seattle, de Praga a Niza. Los anarquistas no ven en esa bandera más que un símbolo que no involucra conquista u opresión. Porque la bandera negra es la negación de todas las demás, el viejo grito de: "Mi familia es la humanidad y mi patria el mundo".


HISTORIA DE LA BANDERA ROJA Y NEGRA.

La bandera roja y negra del anarcosindicalismo surge como la unión en una misma tela de la bandera negra (anarquista) y la bandera roja (sindicalista).

Hoy la podemos ver normalmente cosida en diagonal, sin embargo las primeras banderas rojinegras eran horizontales. La Confederación Sindical Solidaridad Obrera, escisión de la CGT (España), recuperó la bandera rojinegra horizontal como enseña propia.

BANDERA DE GUATEMALA:

Bandera de Guatemala

De Wikipedia, la enciclopedia libre

La bandera de Guatemala fue creada por el Decreto Ejecutivo del 10 de agosto de 1871, siendo presidente de la República el general Miguel García Granados.

FIAV 011011.svg Bandera nacional (ratio 5:8)
FIAV 100100.svg Bandera y pabellón civil (ratio 5:8)

Posee dos colores: el azul cielo y el blanco. La franja vertical blanca entre las dos celestes representa el hecho de que el país se encuentra entre el océano Pacífico al Oeste y el mar Caribe al Este. En su centro aparece el Escudo Nacional. El color blanco también representa la pureza, la integridad, la fe, la obediencia, la firmeza, la vigilancia, la paz y la nación. El color azul simboliza la justicia, la lealtad, la dulzura, la fortaleza, el cielo guatemalteco y los dos mares citados que bañan las costas del este y oeste del país, respectivamente, al igual que las de Centroamérica.

El diseño está basado en la bandera de las Provincias Unidas del Centro de América, aunque en esta última las franjas son horizontales, y las franjas exteriores son azules, no celestes. Las banderas de los otros países que conformaron las Provincias Unidas del Centro de América siguen este patrón.

Ampliar información de la historia y ver el diseño original de la bandera podrá encontrarla en [1]

Contenido

[ocultar]

Banderas y escudos anteriores [editar]

1823–1838 Bandera y escudo de armas usados por la provincia de Guatemala [editar]

Guatemala, como parte de las Provincias Unidas del Centro de América, adoptó la bandera y el escudo de armas aprobados por la Asamblea Nacional Constituyente de Centroamérica, según decreto n.º 29 del 21 de agosto de 1823. La Bandera de las Provincias Unidas del Centro de América constaba de tres franjas horizontales: azules la superior e inferior y blanca la del centro. Este es el citado decreto:

DECRETO CREADOR DEL ESCUDO Y LA BANDERA DE LAS PROVINCIAS UNIDAS DEL CENTRO DE AMÉRICA

DECRETO n.º 29

La Asamblea Nacional Constituyente de las Provincias Unidas del Centro de América, ha tenido a bien decretar y decreta:

Artículo 1º El Escudo de Armas de las Provincias Unidas del Centro de América será un triángulo equilátero; en su base aparecerá una cordillera de cinco volcanes, sobre un terreno que se

Decreto de creación de la bandera [editar]

El 10 de agosto de 1871, siendo presidente de la República el general Miguel García Granados, se hizo el siguiente Decreto Ejecutivo que creó la actual bandera guatemalteca:

EL DECRETO QUE NOS DA LOS SÍMBOLOS NACIONALES

DECRETO n.º 12

Miguel García Granados, presidente provisorio de la República de Guatemala.

Considerando: que la Revolución que se ha verificado impone el deber de adoptar un nuevo pabellón que esté en mejor armonía con las leyes fundamentales que establecen la independencia absoluta de la República.

Que este requisito se cumple restableciendo los colores fijados en el Decreto de la Asamblea Nacional Constituyente de 21 de agosto de 1823;

DECRETA:

Artículo 1. Los colores nacionales serán el azul y el blanco, dispuestos en tres fajas verticales, quedando la blanca en el centro.

Artículo 2. El Pabellón Nacional llevará sobre la faja blanca el Escudo de Armas de la República.

Artículo 3. El pabellón mercante será el mismo, pero sin Escudo.

Artículo 4. La cucarda llevará los mismos colores nacionales dispuestos en la misma forma.

Dado en el Palacio del Gobierno, en Guatemala, a diez de agosto de mil ochocientos setenta y uno. Miguel García Granados. El Ministro de Relaciones Exteriores encargado de la Secretaría de Gobernación, Felipe Gálvez.

Decreto de creación del escudo [editar]

Tres meses después, el 18 de noviembre del mismo año, el mismo gobierno aprobó el Decreto n.º 33 que adoptó el actual Escudo Nacional:

DECRETO n.º 33

Debiendo estar en armonía el Escudo de Armas de la República con los principios políticos que ha proclamado la Nación; en uso de las facultades de que me hallo investido,

DECRETO:

Artículo único.- Las armas de la República serán: un escudo con dos rifles y dos espadas enlazadas con dos ramas de laurel, en cada campo celeste claro. El centro será cubierto con un pergamino, que contendrá la siguiente leyenda en letras de oro: Libertad 15 de septiembre de 1821; figurando en la parte superior un quetzal como símbolo de la independencia y autonomía de la nación.

Dado en Guatemala, a dieciocho de noviembre de mil ochocientos setenta y uno. El Ministro del Interior (f) FRANCISCO ALBUREZ (f) MIGUEL GARCÍA GRANADOS.

Decreto de regulación de la bandera y el escudo [editar]

El 12 de septiembre de 1968, siendo presidente de la República don Julio César Méndez Montenegro, se emitió el siguiente Acuerdo Gubernativo:

PALACIO NACIONAL

Guatemala 12 de septiembre de 1968

EL PRESIDENTE CONSTITUCIONAL DE LA REPÚBLICA,

CONSIDERANDO:

Que mediante Decretos números 12 y 33 de fechas 10 de agosto y 18 de noviembre de 1871, dictados por el entonces presidente de Guatemala general Miguel García Granados, se establecieron respectivamente, la bandera y el escudo de armas de la República,

CONSIDERANDO:

Que la falta de una reglamentación adecuada en materia tan importante, ha dado origen a que dichos símbolos patrios se hayan venido representando en forma caprichosa y arbitraria, tanto que en lo que se refiere al matiz de sus colores como al diseño del escudo de armas de la República,

CONSIDERANDO:

Que por Acuerdo Gubernativo de fecha 30 de noviembre de 1967 se designó una comisión con el objeto de que efectuó los estudios pertinentes a la correcta aplicación de las leyes mencionadas, la que después de meritoria labor rindió dictamen presentando el proyecto respectivo:

POR TANTO:

En uso de las facultades que le confiere el inciso 4º del artículo 189 de la Constitución de la República.

En Consejo de Ministros

ACUERDA:

Artículo 1. La bandera de Guatemala es la insignia suprema de la Patria. Lleva en su centro el escudo de armas de la República, de conformidad con lo estipulado en los Decretos números 12 y 33 de 10 de agosto y 18 de noviembre de 1871.

Artículo 2. La bandera no ostenta ninguna leyenda o inscripción adicional salvo en los casos específicos previstos por los reglamentos militares.

Artículo 3. Los colores de la bandera serán el azul y el blanco, dispuestos en tres franjas verticales del mismo ancho: dos azules los extremos y una blanca en medio. La franja blanca lleva en su centro el escudo de armas de la República, en dimensiones proporcionales a las de la Insignia Patria; la bandera mercante será la misma, pero sin escudo.

El color azul que expresa justicia y lealtad corresponde al azul del cielo de Guatemala y en la nomenclatura de uso internacional se designa como ISCC-NBC 177, o VM 1.6 PB 5.9/9.4. El color blanco, que simboliza pureza e integridad, equivale al ISCC-NBS 263, o VM 2.5 PB 9.5/0.2.

Artículo 4. La forma de la bandera es un rectángulo con las dimensiones proporcionales, vertical y horizontal, de 5 a 8 respectivamente. La relación de 5 a 8 corresponde a la regla de oro de la proporción estética.

DEL ESCUDO

Artículo 5. El escudo de armas de la República, cuando se diseñe independientemente de la bandera, irá en campo celeste claro conforme Decreto de su creación. Dicho color, que representa idealidad, equivale al ISCC-NBS 184, o VM 1.5 PB 8.3/3.3.

Artículo 6. Los rifles Remington de la época (1871), se representan con bayoneta triangular calada, de perfil, con el guardamontes hacia abajo, y entrecruzados en ángulo recto en el centro del escudo.

Artículo 7. Las espadas, símbolo de justicia y soberanía, desenvainadas y en oro, se entrecruzan en ángulo recto al de los rifles.

Artículo 8. Las ramas de laurel, símbolo de victoria, que enlazan las armas, se representan al natural con frutos, entrecruzadas en la parte inferior y sin atadura alguna. Las hojas inferiores de las ramas enlazan con las empuñaduras de las espadas, las subsiguientes con las culatas de los rifles y las últimas, en el extremo superior, con las bayonetas.

Artículo 9. El pergamino, cuya leyenda hace inmortal la fecha del nacimiento de la Patria, va desenrollado en el centro del escudo, sobre el cruce de los rifles; tiene una vuelta y media hacia el frente de la parte superior y vuelta y media hacia el reverso en la inferior, descansando ésta sobre las hojas de las espadas. Centrada en el pergamino, figura la siguiente leyenda en letras de oro, mayúsculas, en cuatro líneas, así: en la primera LIBERTAD, en la segunda 15 DE, en la tercera SETIEMBRE, y en la cuarta DE 1821.

Artículo 10. En la parte superior del pergamino posa el Quetzal, símbolo supremo de libertad. Se representa diestrado, en sus colores propios. Las plumas caudales más largas, pasan sobre las ramas del lado correspondiente y sobrepasan ligeramente las hojas inferiores del laurel.

DISPOSICIONES GENERALES

Artículo 11. La bandera de Guatemala, como máximo emblema de la Patria, no saluda ni rinde honores.

Artículo 12. En lo que se refiere al uso de las insignias nacionales, continúan en vigor el “Reglamento para el Servicio del Ejército en Tiempo de Paz” (Acuerdo Gubernativo de 29 de abril de 1935, modificado por el de 8 de abril de 1960) y el “Reglamento de Instrucción de Infantería de Orden Cerrado” (Acuerdo Gubernativo de 23 de enero de 1957), así como las demás disposiciones gubernativas que traten sobre la materia, en el entendido de que deben de adaptarse a lo preceptuado en el presente reglamento.

Artículo 13. Toda persona, individual o jurídica, que se dedique a la elaboración de banderas y escudos nacionales, deberá solicitar previamente en cada caso, a la Dirección General de Cultura y Bellas Artes, la aprobación del modelo respectivo, a fin de que dichas insignias se ajusten a lo establecido en el presente Acuerdo. La mencionada dependencia hará la comprobación correspondiente, antes de que las insignias se pongan a disposición del público.

Artículo 14. La nomenclatura empleada en este reglamento corresponde a la de la Sociedad Internacional del Consejo del Color (ISCC), conjuntamente con la Oficina Nacional de Normas de los Estados Unidos de Norteamérica (NBS), así como a la del Sistema Internacional de Designación de Colores de la Casa “Munsel Color Company” (VM).

Artículo 15. Los particulares, entidades públicas o privadas, empresas y establecimientos de toda naturaleza que a la fecha ostentaren los símbolos patrios en forma distinta a los colores, dimensión y diseño descritos en este reglamento, deberán sustituirlos por los que corresponden conforme a lo preceptuado en los artículos que anteceden.

Artículo 16. Dicha sustitución no incluye a los símbolos y documentos de valor histórico ni a los que forman parte integrante de monumentos o edificaciones en general.

En cuanto al uso del escudo en monedas y demás valores del Estado, se estará a lo que disponen las leyes y reglamentos de la materia.

Artículo 17. El presente Acuerdo entrará en vigor el quince de septiembre en curso, Día de la Patria.

Comuníquese,

MÉNDEZ MONTENEGRO

El Ministro de Educación, Ministro de Gobernación, CARLOS MARTÍNEZ DURÁN HÉCTOR MANSILLA PINTO Ministro de la Defensa Nacional, Ministro de Comunicaciones y Obras Públicas, ROLANDO CHICHILLA AGUILAR OSCAR CASTAÑEDA FERNÁNDEZ Ministro de Hacienda y Crédito Público, Ministro de Salud Pública y Asistencia Social, MARIO FUENTES PIERUCCINI EMILIO POITEVIN-C. Ministro de Agricultura, Ministro de Economía, FRANCISCO MONTENEGRO JOSÉ LUIS BOUSCAYROL Viceministro de Relaciones Exteriores Ministro de Trabajo y Previsión Social, Encargado Del Despacho, JOSÉ LUIS DE LA ROCA SANTA CRUZ GIL ARTURO GONZÁLEZ SOLÍS

Más información podrá encontrarla en [2]


Cronología [editar]

Véase también [editar]

Reducción al absurdo (del latín Reductio ad absurdum) es un método de demostración (formalizado y a menudo usado por Aristóteles como un argumento lógico) en el que suponemos una hipótesis y obtenemos un resultado absurdo, por lo que concluimos que la hipótesis de partida ha de ser falsa. Este método es también conocido como prueba por contradicción o prueba ad absurdum. Parte de la base es el cumplimiento de la ley de exclusión de intermedios: una afirmación que no puede ser falsa, ha de ser consecuentemente verdadera.

En matemáticas [editar]

Supongamos que se desea demostrar la proposición P. El procedimiento consiste en demostrar que asumiendo como cierta la falsedad de P (o sea, P negada) conduce a una contradicción lógica. Esta P no puede ser falsa, por lo que ha de ser verdadera.

Por ejemplo, consideremos la proposición "no existe un número racional mínimo mayor que cero". En una reducción al absurdo, comenzaríamos por asumir lo contario que existe un mínimo número racional y que es mayor que cero; llamémoslo r0.

Ahora, hagamos x = r0/2. Por lo tanto, x es un número racional mayor que cero; y x es más pequeño que r0. Pero eso es absurdo, contradice nuestra hipótesis de partida de que r0 era el número racional mínimo. Por lo tanto, debemos concluir que la proposición que asumimos como cierta: "hay un número racional mínimo mayor que cero" es falsa.

No es inusual utilizar este tipo de razonamiento con proposiciones como la indicada, acerca de la inexistencia de cierto elemento matemático. Se asume que ese elemento existe y se prueba que eso conduce a una contradicción; por lo tanto, ese objeto no existe. Por ejemplo, se puede probar de esta manera que la raíz cuadrada de 2 es irracional.

La demostración por reducción al absurdo es un tipo de argumento lógico muy empleado en las demostraciones matemáticas. Consiste en demostrar una proposición matemática probando que el que no lo sea conduce a una contradicción.

Un ejemplo es la demostración de que la raíz cuadrada de 2 es un número irracional. La afirmación inicial es la contraria: imagínese que es un número racional, es decir, que

sqrt{2} = frac{p}{q}, donde p y q son números enteros, y que q es distinto de 0. Sin pérdida de generalidad, se puede suponer que p y q son positivos (si los dos son negativos, basta con multiplicarlos por -1), y que son primos entre sí, es decir, que no comparten ningún factor común (en caso contrario, basta con dividirlos entre su máximo común divisor).

Elevando al cuadrado:

2 = frac{p^2}{q^2}

Multiplicando por mathit{q^2} ,! se tiene:

mathit{2q^2 = p^2} ,!

La expresión mathit{2q^2} ,! es un número par, así que mathit{p^2} ,! también lo es. Eso implica que mathit{p} ,! es par, porque, de no serlo, mathit{p^2} ,! no sería par, con lo que no se podría cumplir la igualdad. Sea mathit{p=2n} ,!, donde mathit{n} ,! es un número entero. Así, la expresión queda:

mathit{2q^2=(2n)^2=4n^2} ,!

Simplificando, se tiene:

mathit{q^2=2n^2} ,!

Por el mismo razonamiento de antes, mathit{2n^2} ,! es un número par, así es que mathit{q^2} ,! también es par, y mathit{q} ,! también es par.
Como mathit{p} ,! y mathit{q} ,! son los dos pares, eso quiere decir que tienen al menos un factor común, que es mathit{2} ,!. Esto entra en contradicción con la forma en que se han elegido los números mathit{p} ,! y mathit{q} ,! para que no tuvieran ningún factor común. Como esta elección de mathit{p} ,! y mathit{q} ,! se hizo sin pérdida de generalidad y el razonamiento posterior es correcto, eso quiere decir que la premisa inicial de que sqrt{2} era racional es falsa.
Luego sqrt{2} es irracional,
C.Q.D.

Es importante advertir que para construir una prueba válida, debe demostrarse que, dada una proposición mathit{P} ,!, "no mathit{P} ,!" implica una propiedad que es falsa en el sistema matemático utilizado. El peligro es la falacia lógica de la argumentación por ignorancia, donde se prueba que "no mathit{P} ,!" implica una propiedad "mathit{Q} ,!" que parece falsa pero que realmente no se ha demostrado que lo es. Un ejemplo clásico de esta falacia es la falsa demostración de un quinto postulado de Euclides a partir de los anteriores. En el momento en que se establecieron esas pruebas, parecían correctas debido a que no se contemplaba otra geometría que la euclidiana; pero con la aparición de otras geometrías dio al traste con el sistema. Para una más profunda explicación de esos malentendidos, ver Morris Kline, Mathematical Thought: from Ancient to Modern Times.

Aunque se utiliza con gran libertad en demostraciones matemáticas, no todas las escuelas de pensamiento matemático aceptan la reducción al absurdo como universalmente válidas. En escuelas como la del intuicionismo, la ley de exclusión de intermedios no se acepta como válida. Desde este punto de vista, hay una diferencia muy significativa entre demostrar que algo que existe demostrando que sería absurdo que no lo hiciera y construyendo un ejemplo real de ese algo.

En lógica simbólica, la reducción al absurdo se representa:

si S cup { neg P } vdash F entonces S  vdash P

En esta representación, P es la proposición a demostrar, y S es una serie de proposiciones previas que tomamos como ciertas (por ejemplo, los axiomas de la teoría en la que trabajamos o los teoremas anteriores que ya han sido demostrados). Consideramos la negación de P en conjunto con S. Si esto lleva a una contradicción F, entonces podemos concluir que S nos conduce necesariamente a P.

En palabras de G. H. Hardy, "La Reducción al absurdo, que Euclides tanto amaba, es una de las mejores armas de la matemática. Es mucho mejor gambito que cualquiera de los del ajedrez: un jugador de ajedrez puede ofrecer el sacrificio de un peón u otra pieza, pero un matemático ofrece la partida".

Véase también [editar]

13/05/2010 20:12 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ARMONÍA. El término armonía (arcaicamente, y también aceptado harmonía) tiene muchos significados, musicales y extramusicales, relacionados de alguna manera entre sí. En general, "armonía" significa equilibrio en las proporciones entre las distintas partes de un todo, y en general, connota belleza. En música, la armonía es la disciplina que estudia la percepción del sonido en forma "vertical" o "simultánea" en forma de acordes y la relación que se establece con los de su entorno próximo. En la jerga del tango se llama "armonía" a la contramelodía ejecutada en el violín o las cuerdas de una orquesta.

Armonía

De Wikipedia, la enciclopedia libre

ARMONÍA DEL FLAMENTO (ARRIBA)

DANZA DE LAS MIL MANOS (CHINA)

FUENTE DE LA ARMONÍA (ARRIBA)

 

Para otros usos del término, vea Armonía (desambiguación).
La "consonante" tríada mayor está compuesta de tres tonos, en una relación de números enteros: 6 a 5 a 4.
Traité de l’harmonie (Tratado de la armonía), de Jean-Philippe Rameau.

El término armonía (arcaicamente, y también aceptado harmonía) tiene muchos significados, musicales y extramusicales, relacionados de alguna manera entre sí. En general, "armonía" significa equilibrio en las proporciones entre las distintas partes de un todo, y en general, connota belleza. En música, la armonía es la disciplina que estudia la percepción del sonido en forma "vertical" o "simultánea" en forma de acordes y la relación que se establece con los de su entorno próximo. En la jerga del tango se llama "armonía" a la contramelodía ejecutada en el violín o las cuerdas de una orquesta.

Como otras disciplinas humanas,cuando el estudio de la armonía presenta dos versiones: el estudio descriptivo (es decir: las observaciónes de la práctica musical) y el estudio prescritivo (es decir: la transformación de esta práctica musical en un conjunto de normas de supuesta validez universal).

El estudio de la armonía sólo se justifica en relación a la música occidental, ya que la Occidental es la única cultura que posee una música "polifónica", es decir, una música en la que se usa ejecutar distintas notas musicales en forma simultánea y coordinada. De modo que, a pesar de que el estudio de la armonía pueda tener alguna base científica, las normas o las descripciones de la armonía tienen un alcance relativo, condicionado culturalmente.

En la música occidental, la armonía es la subdisciplina que estudia el encadenamiento de diversas notas superpuestas; es decir: la organización de los acordes. Se llama "acorde" a la combinación de tres o más notas diferentes que suenan simultáneamente (o que son percibidas como simultáneas, aunque sean sucesivas, como en un arpegio). Cuando la combinación es solo de dos notas, se llama "bicordio". Esto también puede ser considerado un acorde.

El estudio de la armonía se refiere generalmente al estudio de las progresiones armónicas y de los principios estructurales que las gobiernan.[1]

La armonía se refiere al aspecto «vertical» (simultáneo en el tiempo) de la música, que se distingue del aspecto horizontal (la melodía, que es la sucesión de notas en el tiempo).[2] La idea de vertical y horizontal es una metáfora explicativa, relacionada a la disposición de las notas musicales en una partitura: verticalmente se escriben las notas que se interpretan a la vez, y horizontalmente las que se interpretan en forma sucesiva.

En la escolástica musical, el contrapunto es una disciplina complementaria a la armonía (y que se confunde con ella), pero que se centra más en la elaboración de melodías que sean combinables simultáneamente que en los acordes resultantes de tal combinación. Es decir: se centra más en la percepción de las partes que en la del todo. Como disciplina creativa (y no como disciplina académica), el contrapunto tuvo su auge durante el Barroco, particularmente con la figura de Johann Sebastian Bach.

Contenido

[ocultar]

Definiciones [editar]

Las definiciones habituales de la armonía suelen describirla como la «ciencia que enseña a constituir los acordes y que sugiere la manera de combinarlos en la manera más equilibrada, consiguiendo así sensaciones de relajación, sosiego (armonía consonante), y de tensa e hiriente (armonía disonante)".

Esta definición se basa en la idea de que ciertas combinaciones de sonidos (intervalos o acordes) producen al oyente una sensación de tensión (combinaciones que se llaman "disonantes") y otras producen una sensación de reposo o calma (combinaciones "consonantes").

Esta diferencia entre sonidos "consonantes" y "disonantes" tiene una base acústica: cada sonido incluye dentro de sí a varios sonidos que suenan con menor volumen (llamados "armónicos"); cuando la combinación de sonidos ejecutados incluye a varias notas con sonidos "armónicos" en común, tales combinaciones serán percibidas como "consonantes".

Ahora bien, en la percepción humana no sólo intervienen factores físicos, sino también (y sobre todo) factores culturales. Lo que un hombre del siglo XV percibía como consonante, puede llamar la atención a uno del siglo XXI, y una combinación de sonidos que sugiere una sensación de "reposo" a un japonés puede no sugerírselo a un mexicano.

Si el estudio occidental de la armonía ha querido presentarla como una "ciencia", pues, es sólo un intento de legitimar como válida universalmente a una práctica musical concreta.

En la terminología musical, suele oponerse la melodía que la melodía es algo "lineal", a la armonía, que es el conjunto sonoro que forman las voces en un instante determinado.

Origen del término e historia del uso [editar]

El término «armonía» deriva del griego ἁρμονία (harmonía), que significa ‘acuerdo, concordancia’[3] y éste del verbo ἁρμόζω (harmozo): ‘ajustarse, conectarse’.[4]

Sin embargo, el término no se utilizaba en su acepción actual de armonía polifónica (es decir, de la relación ordenada entre varias melodías superpuestas, formando un todo que mantiene cierta autonomía respecto de cada una de las partes), ya que la ejecución simultánea de notas distintas (exceptuando las notas distantes entre sí en una o más octavas, que el oído humano percibe como idénticas) no formó parte de la práctica musical de Occidente hasta entrada la Edad Media.

En la música de la antigua Grecia, el término se usaba más bien como un sistema de clasificación de la relación entre un tono grave y otro agudo.[1] En la Edad Media, el término se usaba para describir dos tonos que sonaban en combinación, y en el Renacimiento el concepto se expandió para denotar tres tonos sonando juntos.[5]

El Traité de l’harmonie (1722), de Rameau, fue el primer texto acerca de la práctica musical que incluía el término «armonía» en el título. Sin embargo, no significa que esa fuera la primera discusión teórica acerca de este tema. Como todo texto teórico (particularmente de esta época), se basa en la observación de la práctica; Rameau observa la práctica musical de su época y elabora algunas reglas, otorgándole una supuesta validez universal. Especial importancia tiene en su desarrollo el fenómeno de la resonancia armónica para la justificación de los distintos elementos. Este y otros textos similares tienden a relevar y codificar las relaciones musicales que estaban íntimamente vinculadas con la evolución de la tonalidad desde el Renacimiento hasta fines del periodo románico.

El principio que subyace a estos textos es la noción de que la armonía sanciona la armoniosidad (los sonidos que complacen) si se adapta a ciertos principios compositivos preestablecidos.[6]

Desarrollo [editar]

Melodía, contrapunto y armonía están totalmente interrelacionadas. Tradicionalmente, la armonía funciona como acompañamiento, armazón y base de una o más melodías. La melodía (dimensión horizontal de la música) es una sucesión (en el tiempo) de sonidos pertenecientes a acordes, que son enriquecidos con otros sonidos que adornan y suavizan, y que producen efectos expresivos, complementando a los anteriores gracias a las sutiles relaciones que entablan con los acordes en que se basa esa melodía (integrándose perfectamente con la armonía).

Tensión y reposo [editar]

Desde hace varios siglos se descubrió que algunas combinaciones de acordes producen una sensación de tensión y tendencia al reposo. Algunos acordes, en un determinado contexto, tienen un sentido conclusivo y otros un sentido transitorio (aunque en realidad esto es relativo y depende de su relación con el conjunto de la composición. En la música académica europea, desde el final del siglo XVII hasta comienzos del siglo XX, hasta el oído menos cultivado puede distinguir cuándo está próximo o distante el final de una frase musical.

La armonía tradicional de parte del estilo prebarroco, barroco, clásico y romántico se conoce como armonía tonal, ya que está basada en el sistema tonal, teniendo una fuerte función estructural, siendo determinante en la forma musical de una determinada composición.

A partir del romanticismo musical (siglo XIX), empieza a utilizarse con más fuerza el valor colorista de la armonía, debilitando paulatinamente la función estructural de la armonía tonal e introduciendo cada vez más modalismos (proceso que culmina con la aparición de compositores impresionistas, nacionalistas y contemporáneos neoclásicos que utilizarán una armonía más libre y modal).

En la música popular [editar]

La música popular suele utilizar armonías modales y muy características (caso del flamenco), o armonías con un mayor componente tonal empleadas de manera sencilla (caso del tango), como así también armonías modales parecidas a las utilizadas por ciertos compositores de música culta a principios del siglo XX (caso de música pop/rock/música electrónica). Lo que sí es cierto es que entre la música culta y la popular ha habido una continua trasferencia de materiales musicales, entre ellos los armónicos, aunque es la culta la que ha llevado más al extremo su desarrollo.

Notas [editar]

  1. a b Carl Dahlhaus: «Harmony», en Grove Music Online, editado por L. Macy, GroveMusic.com (acceso por suscripción; consultado el 24 de febrero de 2007).
  2. Deborah Jamini: Harmony and Composition: Basics to Intermediate (pág. 147), 2005. ISBN 1-4120-3333-0.
  3. «Harmony», definición en The Concise Oxford Dictionary of English Etymology in English Language Reference, consultado en OxfordReference.com el 24 de febrero de 2007).
  4. Perseus.Tufts.edu («Harmonia», en A Greek-English Lexicon, de Henry George Liddell y Robert Scott).
  5. Según el Grove.
  6. Arnold Whittall, «Harmony», en [http://www.oxfordreference.com/views/ENTRY.html?this is gayubview=Main&entry=t114.e3144 The Oxford Companion to Music, ed. Alison Latham: Oxford University Press, 2002; consultado el 16 de noviembre de 2007.

Enlaces externos [editar]

13/05/2010 16:40 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: ESCATOLOGÍA: EL CONJUNTO VACÍO. En matemáticas, específicamente en teoría de conjuntos, el conjunto vacío es el único conjunto que no contiene elementos. En la axiomática de Teoría de conjuntos se postula el axioma del conjunto vacío. Algunas propiedades de los conjuntos son trivialmente ciertas para el conjunto vacío.

Conjunto vacío

De Wikipedia, la enciclopedia libre

El conjunto vacío es aquél que no tiene elementos.

En matemáticas, específicamente en teoría de conjuntos, el conjunto vacío es el único conjunto que no contiene elementos. En la axiomática de Teoría de conjuntos se postula el axioma del conjunto vacío. Algunas propiedades de los conjuntos son trivialmente ciertas para el conjunto vacío.

Contenido

[ocultar]

Notación [editar]

El conjunto vacío es denotado por cualquiera de estos símbolos:

 varnothing , acute{o} ; emptyset ,

derivada de la letra Ø (introducida especialmente por André Weil) en 1939.

Otra notación común para el conjunto vacío es:

 { } ,

Propiedades [editar]

(Aquí usaremos símbolos usados en matemáticas.)

  • Para todo conjunto A, el conjunto vacío es subconjunto de A:
 forall A : ; varnothing subseteq A
  • Para todo conjunto A, la unión de A con el conjunto vacío es A:
 forall A : ; A cup varnothing = A
  • Para todo conjunto A, la intersección de A con el conjunto vacío resulta el conjunto vacío:
 forall A : ; A cap varnothing = varnothing
  • Para todo conjunto A, el producto cartesiano de A y el conjunto vacío es vacío:
  forall A : ; A times varnothing = varnothing times A = varnothing
  • El único subconjunto del conjunto vacío es él mismo, el conjunto vacío:
 forall A : ; A subseteq varnothing ; Rightarrow ; A = varnothing
  • El número de elementos del conjunto vacío (es decir, su número cardinal) es cero; en particular, el conjunto vacío es un conjunto finito:
 | varnothing | = 0  que se puede expresar:  {Card}(varnothing) = 0
  • Para cualquier propiedad se tiene:
    • para todo elemento del  varnothing la propiedad es cierta (por vacuidad)
    • no hay elementos en el  varnothing para los cuales la propiedad sea cierta
  • Entonces: si, para alguna propiedad, las dos proposiciones siguientes son ciertas:
    • para todo elemento de V la propiedad es cierta
    • y no hay elementos en V que cumplan la propiedad
por lo tanto  V = varnothing

Los matemáticos generalmente hablan de 'el conjunto vacío' y no de 'un' conjunto vacío, pues en Teoría de conjuntos, dos conjuntos son iguales si y sólo si uno es subconjunto del otro y viceversa, i.e. tienen los mismos elementos. En conclusión, sólo hay un conjunto vacío.

Problemas comunes [editar]

El conjunto vacío, a pesar de contener nada, sigue siendo algo en sí mismo: un conjunto. Esta distinción es importante si situamos a los conjuntos en un contexto. Por ejemplo, si imaginamos a los conjuntos como bolsas, capaces de contener distintos elementos, el conjunto vacío sería aquella bolsa sin elementos dentro; pero aun así seguiría siendo una bolsa.

Es por esto que el conjunto potencia siempre contiene al conjunto vacío.

Todo conjunto es subconjunto de sí mismo, por lo tanto, el conjunto vacío es vacío en el sentido de su cardinalidad (que es igual a 0), y no en el sentido de su identidad.

Véase también [editar]

Referencias [editar]

  • Paul Halmos, Naive set theory. Princeton, NJ: D. Van Nostrand Company, 1960. Reprinted by Springer-Verlag, New York, 1974. ISBN 0-387-90092-6 (Springer-Verlag edition).
  • Jech, Thomas, 2003. Set Theory: The Third Millennium Edition, Revised and Expanded. Springer. ISBN 3-540-44085-2.
13/05/2010 16:34 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: CONJUNTO (ESCATOLOGÍA). En matemáticas, un conjunto es un concepto fundamental , y como tal no admite definición en términos de conceptos más fundamentales.[1] A veces se lo presenta como un concepto autoevidente, o por medio de sinónimos. Por ejemplo, a veces se dice que un conjunto es una colección de objetos.[1] Por objeto aquí no debe entenderse sólo las entidades físicas, como las mesas y las sillas, sino todo objeto en el sentido más amplio de la palabra: mesas, sillas, personas, ideas, creencias, lenguajes, letras, otros conjuntos, etc. A los objetos que pertenecen a un conjunto se los llama miembros o elementos del conjunto.

Conjunto

De Wikipedia, la enciclopedia libre

CONJUNTOS FRACTALES:

Conjuntos.

En matemáticas, un conjunto es un concepto fundamental , y como tal no admite definición en términos de conceptos más fundamentales.[1] A veces se lo presenta como un concepto autoevidente, o por medio de sinónimos. Por ejemplo, a veces se dice que un conjunto es una colección de objetos.[1] Por objeto aquí no debe entenderse sólo las entidades físicas, como las mesas y las sillas, sino todo objeto en el sentido más amplio de la palabra: mesas, sillas, personas, ideas, creencias, lenguajes, letras, otros conjuntos, etc. A los objetos que pertenecen a un conjunto se los llama miembros o elementos del conjunto.

Otras veces se toma a los axiomas de la teoría de conjuntos como proveyendo una definición implícita de lo que es un conjunto: un conjunto es todo aquello que cumple con los axiomas.[1] Sin embargo, esto conlleva el riesgo de que haya más de una interpretación que haga verdaderos a los axiomas (más de un modelo), y por lo tanto de que haya más de un definiendum

La cantidad de elementos de un conjunto puede ser finita o infinita.[2] Por ejemplo, el conjunto de los números naturales, que son infinitos, es un conjunto tanto como el conjunto de los planetas del Sistema Solar, que son ocho.

En un conjunto, el orden de los elementos es irrelevante.[2] El conjunto compuesto por Venus y Mercurio es el mismo que el compuesto por Mercurio y Venus. También es irrelevante si se repite un elemento.[2] Venus y Mercurio forman el mismo conjunto que Mercurio y Venus.

Los conjuntos no deben ser confundidos con los agregados. Los primeros son estudiados por la teoría de conjuntos, los segundos por la mereología. Los primeros son siempre entidades abstractas, los segundos no siempre. Por ejemplo, el conjunto de todas las personas no tiene ningún peso, pero el agregado de todas las personas sí.

Contenido

[ocultar]

Determinación de un conjunto [editar]

Un conjunto se puede determinar de dos maneras: por extensión y por comprensión

Por extensión [editar]

Un conjunto está determinado por extensión cuando se escriben uno a uno todos sus elementos. Por ejemplo, el conjunto de los números naturales menores que 9:

    A = {1, 2, 3, 4, 5, 6, 7, 8 } ,
Por comprensión [editar]

Un conjunto está determinado por comprensión cuando solamente se menciona una característica común de todos los elementos. Por ejemplo, el conjunto formado por las letras vocales del abecedario:

B = {x: x ; es ; una ; vocal } ,

Dos conjuntos son idénticos si, y sólo si, contienen los mismos elementos. Se puede obtener una descripción más detallada en la teoría de conjuntos.

Las aplicaciones de teoría de conjuntos son muy amplias, y baste con mencionar que se utiliza en el diseño de circuitos en electrónica digital; en cuestiones relacionadas con probabilidad; y sus conceptos están de manera implícita en la terminología utilizada en diseño de bases de datos, cuando se realizan las consultas. conjuntos de varios elementos.y esta determinado por comprension y por extension

Representación de un conjunto [editar]

A es subconjunto de B.
Unión de A y B.
Intersección de A y B.

Los conjuntos son uno de los conceptos básicos de la matemática. Como ya se ha dicho, un conjunto es, más o menos, una colección de objetos, denominados elementos. La notación estándar utiliza llaves {, y } alrededor de la lista de elementos para indicar el contenido del conjunto, como por ejemplo:

C = {rojo, amarillo, azul } , D = {rojo, azul, amarillo, rojo } , E = {x: x ; es ; un ; color ; primario } ,

Las tres líneas anteriores denotan el mismo conjunto. Como puede verse, es posible describir el mismo conjunto de diferentes maneras: o bien dando un listado de sus elementos (lo mejor para conjuntos finitos pequeños) o bien dando una propiedad que defina todos sus elementos. Por otro lado, no importa el orden, ni cuantas veces aparezcan en la lista sus elementos.

Si A y B son dos conjuntos y todo elemento x de A está contenido también en B, entonces se dice que A es un subconjunto de B. Todo conjunto tiene como subconjunto a sí mismo y al conjunto vacío, {}.

La unión de una colección de conjuntos:  S= { S_1 , S_2 , S_3 , ... } , es el conjunto de todos los elementos contenidos al menos una vez en los conjuntos   S_1 , S_2 , S_3 , ...  , y se representa:  S=  S_1 cup S_2 cup S_3 cup ...  ,

La intersección de una colección de conjuntos:  T= { T_1 , T_2 , T_3 , ... } , , es el conjunto de todos los elementos contenidos simultáneamente en todos los conjuntos:   T_1 , T_2 , T_3 , ...  , y se representa:  T=  T_1 cap T_2 cap T_3 cap ...  ,

los conjuntos también son nombrados según el número de elementos que tengan ejemplo conjunto vacío, conjunto unitario,conjunto finito,conjunto infinito. Algunos ejemplos de conjuntos de números son:

  1. Los números naturales utilizados para contar los elementos de un conjunto.
  2. Los números enteros.
  3. Los números racionales.
  4. Los números reales, que incluyen a los números irracionales.
  5. Los números complejos que proporcionan soluciones a ecuaciones del tipo: x2 + 1 = 0.

La teoría estadística se construye sobre la base de la teoría de conjuntos y la teoría de la probabilidad.

Relaciones entre conjuntos [editar]

Una categoría matemática consta de dos partes: los objetos y los morfismos. Cuando hablamos de la categoría de conjuntos, los objetos son los mismos conjuntos y un morfismo f entre dos objetos, digamos X e Y, en un tipo de relación entre X e Y dirigida i.e. un subconjunto del producto cartesiano de X con Y, en símbolos:

f subset X times Y

y ésta es una aplicación entre los conjuntos. conjunto de varios elementos y esta determinado por extension y por comprension.

Véase también [editar]

conjunto de varios elementos y esta determinado por comprension y por extension.

Notas y referencias [editar]

  1. a b c Jech, Thomas, «Set Theory», en Edward N. Zalta (en inglés), The Stanford Encyclopedia of Philosophy (Spring 2009 Edition edición), http://plato.stanford.edu/archives/spr2009/entries/set-theory/, consultado el 7 de octubre de 2009 
  2. a b c Weisstein, Eric W., «Set» (en inglés), MathWorld, http://mathworld.wolfram.com/Set.html, consultado el 7 de octumbre de 2009 

13/05/2010 16:31 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: EL TEOREMA DE EUCLIDES. Euclides (en griego Ευκλείδης, Eukleides) fue un matemático y geómetra griego, que vivió alrededor del 300 a.C. (ca. 325 - ca. 265 a. C.). Se le conoce como "El Padre de la Geometría".

Teorema de Euclides

De Wikipedia, la enciclopedia libre

Para otros usos de este término, véase Teorema de Euclides (desambiguación).

El teorema de Euclides sobre la infinitud de los números primos es el siguiente:

El conjunto formado por los números primos es infinito.


Contenido

[ocultar]

Demostración de Euclides [editar]

Euclides formuló la primera demostración en la proposición 20 del libro IX de su obra Elementos.[1] Una adaptación común de esta demostración original sigue así:

Se toma un conjunto arbitrario pero finito de números primos p1, p2, ···, pn, y se considera el producto de todos ellos más uno, q=p1p2 ··· pn+1. Este número es obviamente mayor que 1 y distinto de todos los primos pi de la lista. El número q puede ser primo o compuesto. Si es primo tendremos un número primo que no está en el conjunto original. Si, por el contrario, es compuesto, entonces existirá algún factor p que divida a q. Suponiendo que p es alguno de los pi, se deduce entonces que p divide a la diferencia q-p1p2 ··· pn=1, pero ningún número primo divide a 1, es decir, se ha llegado a un absurdo por suponer que p está en el conjunto original. La consecuencia es que el conjunto que se escogió no es exhaustivo, ya que existen números primos que no pertenecen a él, y esto es independiente del conjunto finito que se tome.

Existen numerosas demostraciones parecidas a ésta, que se formulan a continuación:

Reformulación de Kummer [editar]

Supóngase que existe una cantidad finita de números primos p1 < p2 < p3 < ... < pr. Sea N = p1·p2·p3·...·pr > 2. El entero N-1, al ser producto de primos, tiene un divisor pi que también es divisor de N; así que pi divide a N - (N-1) = 1. Esto es absurdo, por lo que tiene que haber infinitos números primos.

Demostración de Hermite [editar]

Sea n=1, 2, 3, ... y qn el factor primo más pequeño de n! + 1 para cada n. Como qn tiene que ser mayor que n, se deduce que esta sucesión contiene infinitos elementos distintos, y que por tanto existen infinitos números primos.

Demostración de Stieltjes [editar]

Supóngase que existe un número finito de números primos. Sea Q el producto de todos los números primos, y sean m y n dos enteros positivos con Q = mn.
Se tiene que todo número primo p divide, o bien a m, o bien a n, pero no a ambos, es decir, m y n son
primos entre sí. Entonces m+n no puede tener ningún divisor primo, pero como es estrictamente mayor que 1, debe ser un número primo que no divide a Q: contradicción.

Demostración de Goldbach (1730) [editar]

Esta demostración se basa en los números de Fermat, es decir, los números de la forma : F_{n} = 2^{2^n} + 1 .

Lema: Dos números de Fermat distintos Fm y Fn son primos entre sí.


(Goldbach, 1730)

Para cada número de Fermat Fn, escójase un divisor primo pn. Como los números de Fermat son primos entre sí, sabemos que dos primos cualesquiera pm y pn son distintos. Así, hay al menos un número primo pn por cada número de Fermat Fn, es decir, al menos un número primo por cada número entero n.

Esta demostración también es válida si se toma otra secuencia infinita de números naturales que son primos entre sí, como la secuencia de Sylvester.

Otras demostraciones [editar]

Demostración de Euler [editar]

Sea Q el producto de todos los primos. Sea φ(n) la función φ de Euler definida como el número de enteros menores que n y coprimos con él. Entonces φ(Q) es igual al producto de los números que resultan de restarle 1 a cada uno de los números primos, es decir,

φ(Q) = (2-1)·(3-1)·(5-1)·(7-1)·(11-1)·... = 1·2·4·6·10·...

Uno de los números enteros coprimos con Q es 1. Aun así, hay al menos otro entero en el intervalo [2,Q] que no tiene factor común con Q. Ese entero no puede tener ningún factor primo, porque están todos en Q, así que debe ser igual a 1, con lo que se llega a una contradicción.

Demostración topológica de Furstenberg (1955) [editar]

Defínase una topología en el conjunto de los números enteros empleando progresiones aritméticas (de -∞ a +∞). Esto genera un espacio topológico. Para cada número p, sea Ap el conjunto de todos los múltiplos de p. Ap es cerrado, porque su complementario es la unión de todas las demás progresiones aritméticas con diferencia p. Ahora, sea A la unión de las progresiones Ap. Si hay un número finito de números primos, entonces A es una unión finita de conjuntos cerrados, y por tanto A es cerrado. Sin embargo, todos los números enteros, salvo -1 y 1, son múltiplos de algún número primo, así que el complementario de A es {-1, 1} que no es abierto. Esto muestra que A no es una unión finita y que existen infinitos primos.

Referencias [editar]

  1.  , Euclides (1991-1996). «Vol. II, libro IX, proposición 20.», Elementos. Obra completa, Madrid, Editorial Gredos. ISBN 978-84-249-1463-9.
04/05/2010 12:43 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: LA INTEGRACIÓN ES UNIR PUNTOS INFINITAMENTE PEQUEÑOS Y TIENE APLICACIONES EN FÍSICA, ÁREAS Y GEOMETRÍA, AUNQUE EN MUCHAS OTRAS DISCIPLINAS EN ESTAS SON FUNDAMENTALES. La integración es un concepto fundamental de las matemáticas avanzadas, especialmente en los campos del cálculo y del análisis matemático. Básicamente, una integral es una suma de infinitos sumandos, infinitamente pequeños.

Integración

De Wikipedia, la enciclopedia libre

Para otros usos de este término, véase Integración (desambiguación) y INTEGRAL.
La integral definida de una función representa el área limitada por la gráfica de la función, con signo positivo cuando la función toma valores positivos y negativo cuando toma valores negativos.

La integración es un concepto fundamental de las matemáticas avanzadas, especialmente en los campos del cálculo y del análisis matemático. Básicamente, una integral es una suma de infinitos sumandos, infinitamente pequeños.

Dada una función f(x) de una variable real x y un intervalo [a,b] de la recta real, la integral

int_a^b f(x),dx

es igual al área de la región del plano xy limitada entre la gráfica de f, el eje x, y las líneas verticales x = a y x = b, donde son negativas las áreas por debajo del eje x.

La palabra "integral" también puede hacer referencia a la noción de primitiva: una función F, cuya derivada es la función dada f. En este caso se denomina integral indefinida, mientras que las integrales tratadas en este artículo son las integrales definidas. Algunos autores mantienen una distinción entre integrales primitivas e indefinidas.

Newton y Leibniz a finales del siglo XVII. A través del teorema fundamental del cálculo, que desarrollaron los dos de forma independiente, la integración se conecta con la derivación, y la integral definida de una función se puede calcular fácilmente una vez se conoce una antiderivada. Las integrales y las derivadas pasaron a ser herramientas básicas del cálculo, con numerosas aplicaciones en ciencia e ingeniería.

Bernhard Riemann dio una definición rigurosa de la integral. Se basa en un límite que aproxima el área de una región curvilínea a base de partirla en pequeños trozos verticales. A comienzos del siglo XIX, empezaron a aparecer nociones más sofisticadas de la integral, donde se han generalizado los tipos de las funciones y los dominios sobre los cuales se hace la integración. La integral curvilínea se define para funciones de dos o tres variables, y el intervalo de integración [a,b] se sustituye por una cierta curva que conecta dos puntos del plano o del espacio. En una integral de superficie, la curva se sustituye por un trozo de una superficie en el espacio tridimensional.

Las integrales de las formas diferenciales desempeñan un papel fundamental en la geometría diferencial moderna. Estas generalizaciones de la integral surgieron primero a partir de las necesidades de la física, y tienen un papel importante en la formulación de muchas leyes físicas cómo, por ejemplo, las de la electromagnetismo. Los conceptos modernos de integración se basan en la teoría matemática abstracta conocida como integral de Lebesgue, que fue desarrollada por Henri Lebesgue.

Contenido

[ocultar]

Historia [editar]

Integración antes del cálculo [editar]

La integración se puede trazar en el pasado hasta el antiguo Egipto, circa 1800 a. C., con el papiro de Moscú, donde se demuestra que ya se conocía una fórmula para calcular el volumen de un tronco piramidal. La primera técnica sistemática documentada capaz de determinar integrales es el método de exhausción de Eudoxo (circa 370 a. C.), que trataba de encontrar áreas y volúmenes a base de partirlos en un número infinito de formas para las cuales se conocieran el área o el volumen. Este método fue desarrollado y usado más adelante por Arquímedes, que lo empleó para calcular áreas de parábolas y una aproximación al área del círculo. Métodos similares fueron desarrollados de forma independiente en China alrededor del siglo III por Liu Hui, que los usó para encontrar el área del círculo. Más tarde, Zu Chongzhi usó este método para encontrar el volumen de una esfera. En el Siddhanta Shiromani, un libro de astronomía del siglo XII del matemático indio Bhaskara II, se encuentran algunas ideas de cálculo integral.

Hasta el siglo XVI no empezaron a aparecer adelantos significativos sobre el método de exhausción. En esta época, por un lado, con el trabajo de Cavalieri con su método de los indivisibles y, por otro lado, con los trabajos de Fermat, se empezó a desarrollar los fundamentos del cálculo moderno. A comienzos del siglo XVII, se produjeron nuevos adelantos con las aportaciones de Barrow y Torricelli, que presentaron los primeros indicios de una conexión entre la integración y la derivación.

Newton y Leibniz [editar]

Los principales adelantos en integración vinieron en el siglo XVII con el descubrimiento del teorema fundamental del cálculo, realizado de manera independiente por Newton y Leibniz. El teorema demuestra una conexión entre la integración y la derivación. Esta conexión, combinada con la facilidad, comparativamente hablando, del cálculo de derivadas, se puede usar para calcular integrales. En particular, el teorema fundamental del cálculo permite resolver una clase más amplia de problemas. También cabe destacar todo el marco estructural alrededor de las matemáticas que desarrollaron también Newton y Leibniz. El llamado cálculo infinitesimal permitió analizar, de forma precisa, funciones con dominios continuos. Posteriormente, este marco ha evolucionado hacia el cálculo moderno, cuya notación para las integrales procede directamente del trabajo de Leibniz.

Formalización de las integrales [editar]

Aunque Newton y Leibniz suministraron un enfoque sistemático a la integración, su trabajo carecía de un cierto nivel de rigor. Es memorable el ataque del obispo Berkeley calificando los infinitesimales como los "los fantasmas de las cantidades que se desvanecen". El cálculo adquirió una posición más firme con el desarrollo de los límites y, en la primera mitad del siglo XIX, recibió una fundamentación adecuada por parte de Cauchy. La integración fue rigurosamente formalizada por primera vez por Riemann, empleando límites. A pesar de que todas las funciones continuas fragmentadas y acotadas son Riemann integrables en un intervalo acotado, más tarde se consideraron funciones más generales para las cuales no se aplica la definición de Riemann, y Lebesgue formuló una definición diferente de la integral[1] basada en la teoría de la medida. También se propusieron otras definiciones de integral, que amplían las definiciones de Riemann y Lebesgue.

Notación [editar]

Isaac Newton usaba una pequeña barra vertical encima de una variable para indicar integración, o ponía la variable dentro de una caja. La barra vertical se confundía fácilmente con dot{x} o x',!, que Newton usaba para indicar la derivación, y además la notación "caja" era difícil de reproducir por los impresores; por ello, estas notaciones no fueron ampliamente adoptadas.

La notación moderna de las integrales indefinidas fue presentada por Gottfried Leibniz en 1675.[2] [3] Para indicar summa (en latín, "suma" o "total"), adaptó el símbolo integral, "∫", a partir de una letra S alargada. La notación moderna de la integral definida, con los límites arriba y abajo del signo integral, la usó por primera vez Joseph Fourier en Mémoires de la Academia Francesa, alrededor de 1819–20, reimpresa en su libro de 1822.[4] [5] En la notación matemática en árabe moderno, que se escribe de derecha a izquierda, se usa un signo integral invertido Signed'IntegracióArabic.png.[6]

Terminología y notación [editar]

Si una función tiene una integral, se dice que es integrable. De la función de la cual se calcula la integral se dice que es el integrando. Se denomina dominio de integración a la región sobre la cual se integra la función. Si la integral no tiene un dominio de integración, se considera indefinida (la que tiene dominio se considera definida). En general, el integrando puede ser una función de más de una variable, y el dominio de integración puede ser un área, un volumen, una región de dimensión superior, o incluso un espacio abstracto que no tiene estructura geométrica en ningún sentido usual.

El caso más sencillo, la integral de una función real f de una variable real x sobre el intervalo [a, b], se escribe

int_a^b f(x),dx .

El signo ∫, una "S" larga, representa la integración; a y b son el límite inferior y el límite superior de la integración y definen el dominio de integración; f es el integrando, que se tiene que evaluar al variar x sobre el intervalo [a,b]; y dx puede tener diferentes interpretaciones dependiendo de la teoría que se emplee. Por ejemplo, puede verse simplemente como una indicación de que x es la variable de integración, como una representación de los pesos en la suma de Riemann, una medida (en la integración de Lebesgue y sus extensiones), un infinitesimal (en análisis no estándar) o como una cantidad matemática independiente: una forma diferencial. Los casos más complicados pueden variar la notación ligeramente.

Conceptos y aplicaciones [editar]

Las integrales aparecen en muchas situaciones prácticas. Consideremos una piscina. Si es rectangular, entonces, a partir de su longitud, anchura y profundidad, se puede determinar fácilmente el volumen de agua que puede contener (para llenarla), el área de la superficie (para cubrirla), y la longitud de su borde (para atarla). Pero si es ovalada con un fondo redondeado, todas estas cantidades piden integrales. Al comienzo puede ser suficiente con aproximaciones prácticas, pero al final harán falta respuestas exactas y rigurosas a este tipo de problemas.

Aproximaciones a la integral de √x entre 0 y 1, con  5 muestras por la izquierda (arriba) y  12 muestras por la derecha (abajo).

Para empezar, se considerará la curva y = f(x) entre x = 0 y x = 1, con f(x) = √x. La pregunta es:

¿Cuál es el área bajo la función f, al intervalo desde 0 hasta 1?

Esta área (todavía desconocida) será la integral de f. La notación para esta integral será

 int_0^1 sqrt x , dx ,!.

Como primera aproximación, se mira al cuadrado unidad dado por los lados x=0 hasta x=1 y y=f(0)=0 y y=f(1)=1. Su área es exactamente 1. Tal como se puede ver, el verdadero valor de la integral tiene que ser de alguna forma más pequeño. Reduciendo el ancho de los rectángulos empleados para hacer la aproximación se obtendrá un mejor resultado; así, se parte el intervalo en cinco pasos, empleando para la aproximación los puntos 0, 15, 25, así hasta 1. Se ajusta una caja cada paso empleando la altura del lado derecho de cada pedazo de la curva, así √15, √25, y así hasta √1 = 1. Sumando las áreas de estos rectángulos, se obtiene una mejor aproximación de la integral que se está buscando,

sqrt {frac {1} {5}} left ( frac {1} {5} - 0 right ) + sqrt {frac {2} {5}} left ( frac {2} {5} - frac {1} {5} right ) + ldots + sqrt {frac {5} {5}} left ( frac {5} {5} - frac {4} {5} right ) approx 0,7497,!

Nótese que se está sumando una cantidad finita de valores de la función f, multiplicados por la diferencia entre dos puntos de aproximación sucesivos. Se puede ver fácilmente que la aproximación continúa dando un valor más grande que el de la integral. Empleando más pasos se obtiene una aproximación más ajustada, pero no será nunca exacta: si en vez de 5 subintervalos se toman doce y se coge el valor de la izquierda, tal como se muestra en el dibujo, se obtiene un valor aproximado para el área, de 0,6203, que en este caso es demasiado pequeño. La idea clave es la transición desde la suma de una cantidad finita de diferencias de puntos de aproximación multiplicados por los respectivos valores de la función, hasta usar pasos infinitamente finos, o infinitesimales. La notación

 int f(x) , dx ,!

concibe la integral como una suma ponderada (denotada por la "S" alargada), de los valores de la función (como las alzadas, y = f(x)) multiplicados por pasos de anchura infinitesimal, los llamados diferenciales (indicados por dx).

Con respecto al cálculo real de integrales, el teorema fundamental del cálculo, debido a Newton y Leibniz, es el vínculo fundamental entre las operaciones de derivación e integración. Aplicándolo a la curva raíz cuadrada, se tiene que mirar la función relacionada F(x) = 23x3/2 y simplemente coger F(1)−F(0), donde 0 y 1 son las fronteras del intervalo [0,1]. (Éste es un ejemplo de una regla general, que dice que para f(x) = xq, con q ≠ −1, la función relacionada, la llamada primitiva es F(x) = (xq+1)/(q+1).) De modo que el valor exacto del área bajo la curva se calcula formalmente como

 int_0^1 sqrt x cdot dx = int_0^1 x^{frac{1}{2}} cdot dx = int_0^1 d left({textstyle frac 2 3} x^{frac{3}{2}}right) = {textstyle frac 2 3}.

Históricamente, después de que los primeros esfuerzos de definir rigurosamente los infinitesimales no fructificasen, Riemann definió formalmente las integrales como el límite de sumas ponderadas, de forma que el dx sugiere el límite de una diferencia (la anchura del intervalo). La dependencia de la definición de Riemann de los intervalos y la continuidad motivó la aparición de nuevas definiciones, especialmente la integral de Lebesgue, que se basa en la habilidad de extender la idea de "medida" de maneras mucho más flexibles. Así, la notación

 int_A f(x) , dmu ,!

hace referencia a una suma ponderada de valores en que se divide la función, donde μ mide el peso que se tiene que asignar a cada valor. (Aquí A indica la región de integración.) La geometría diferencial, con su "cálculo de variedades", proporciona otra interpretación a esta notación familiar. Ahora f(x) y dx pasan a ser una forma diferencial, ω = f(x)dx, aparece un nuevo operador diferencial d, conocido como la derivada exterior, y el teorema fundamental pasa a ser el (más general) teorema de Stokes,

 int_{A} bold{d} omega = int_{part A} omega , ,!

a partir del cual se deriva el teorema de Green, el teorema de la divergencia, y el teorema fundamental del cálculo.

Recientemente, los infinitesimales han reaparecido con rigor, a través de innovaciones modernas como el análisis no estándar. Estos métodos no sólo reivindican la intuición de los pioneros, también llevan hacia las nuevas matemáticas, y hacen más intuitivo y comprensible el trabajo con cálculo infinitesimal.

A pesar de que hay diferencias entre todas estas concepciones de la integral, hay un solapamiento considerable. Así, el área de la piscina oval se puede hallar como una elipse geométrica, como una suma de infinitesimales, como una integral de Riemann, como una integral de Lebesgue, o como una variedad con una forma diferencial. El resultado obtenido con el cálculo será el mismo en todos los casos.

Integral de Riemann [editar]

Artículo principal: Integral de Riemann
Integral con el planteamiento de Riemann hace una suma basada en una partición etiquetada, con posiciones de muestreo y anchuras irregulares (el máximo en rojo). El verdadero valor es 3,76; la estimación obtenida es 3,648.

La integral de Riemann se define en términos de sumas de Riemann de funciones respecto de particiones etiquetadas de un intervalo. Sea [a,b] un intervalo cerrado de la recta real; entonces una partición etiquetada de [a,b] es una secuencia finita

 a = x_0 le t_1 le x_1 le t_2 le x_2 le cdots le x_{n-1} le t_n le x_n = b . ,!
Convergencia de sumatorios de Riemann a medida en que se parten los intervalos, cuando se muestrea a  la derecha,  el mínimo,  el máximo, o  la izquierda.

Esto divide al intervalo [a,b] en i subintervalos [xi−1, xi], cada uno de los cuales es "etiquetado" con un punto especificado ti de; [xi−1, xi]. Sea Δi = xixi−1 la anchura del subintervalo i; el paso de esta partición etiquetada es el ancho del subintervalo más grande obtenido por la partición, maxi=1…n Δi. Un sumatorio de Riemann de una función f respecto de esta partición etiquetada se define como

sum_{i=1}^{n} f(t_i) Delta_i ;

Así cada término del sumatorio es el área del rectángulo con altura igual al valor de la función en el punto especificado del subintervalo dado, y de la misma anchura que la anchura del subintervalo. La integral de Riemann de una función f sobre el intervalo [a,b] es igual a S si:

Para todo ε > 0 existex δ > 0 tal que, para cualquier partición etiquetada [a,b] con paso más pequeño que δ, se tiene left| S - sum_{i=1}^{n} f(t_i)Delta_i right| < varepsilon

Cuando las etiquetas escogidas dan el máximo (o mínimo) valor de cada intervalo, el sumatorio de Riemann pasa a ser un sumatorio de Darboux superior (o inferior), lo que sugiere la estrecha conexión que hay entre la integral de Riemann y la integral de Darboux.

Integral de Lebesgue [editar]

Artículo principal: Integral de Lebesgue

La integral de Riemann no está definida para un ancho abanico de funciones y situaciones de importancia práctica (y de interés teórico). Por ejemplo, la integral de Riemann puede integrar fácilmente la densidad para de obtener la masa de una viga de acero, pero no se puede adaptar a una bola de acero que se apoya encima. Esto motiva la creación de otras definiciones, bajo las cuales se puede integrar un surtido más amplio de funciones.[7] La integral de Lebesgue, en particular, logra una gran flexibilidad a base de centrar la atención en los pesos de la suma ponderada.

Así, la definición de la integral de Lebesgue empieza con una medida, μ. En el caso más sencillo, la medida de Lebesgue μ(A) de un intervalo A = [a, b] es su ancho, ba, así la integral de Lebesgue coincide con la integral de Riemann cuando existen ambas. En casos más complicados, los conjuntos a medir pueden estar altamente fragmentados, sin continuidad y sin ningún parecido a intervalos.

Para explotar esta flexibilidad, la integral de Lebesgue invierte el enfoque de la suma ponderada. Como expresa Folland:[8] "Para calcular la integral de Riemann de f, se particiona el dominio [a, b] en subintervalos", mientras que en la integral de Lebesgue, "de hecho lo que se está partiendo es el recorrido de f".

Un enfoque habitual define primero la integral de la función característica de un conjunto mensurable A por:

int 1_A dmu = mu(A).

Esto se extiende por linealidad a las funciones escalonadas simples, que sólo tienen un número finito n, de valores diferentes no negativos:

begin{align}  int s , dmu &{}= intleft(sum_{i=1}^{n} a_i 1_{A_i}right) dmu    &{}= sum_{i=1}^{n} a_iint 1_{A_i} , dmu    &{}= sum_{i=1}^{n} a_i , mu(A_i) end{align}

(donde la imagen de Ai al aplicarle la función escalonada s es el valor constante ai). Así, si E es un conjunto mesurable, se define

 int_E s , dmu = sum_{i=1}^{n} a_i , mu(A_i cap E) .

Entonces, para cualquier función mesurable no negativa f se define

int_E f , dmu = supleft{int_E s , dmu, colon 0 leq sleq ftext{ y } stext{ es una funcion escalonada}right};

Es decir, se establece que la integral de f es el supremo de todas las integrales de funciones escalonadas que son más pequeñas o iguales que f. Una función mesurable cualquiera f, se separa entre sus valores positivos y negativos a base de definir

begin{align}  f^+(x) &{}= begin{cases}                f(x), & text{si } f(x) > 0                 0, & text{de otro modo}              end{cases}   f^-(x) &{}= begin{cases}                -f(x), & text{si } f(x) < 0                 0, & text{de otro modo}              end{cases} end{align}

Finalmente, f es Lebesgue integrable si

int_E |f| , dmu < infty , ,!

y entonces se define la integral por

int_E f , dmu = int_E f^+ , dmu - int_E f^- , dmu . ,!

Cuando el espacio métrico en el que están definidas las funciones es también un espacio topológico localmente compacto (como es el caso de los números reales R), las medidas compatibles con la topología en un sentido adecuado (medidas de Radon, de las cuales es un ejemplo la medida de Lebesgue) una integral respecto de ellas se puede definir de otra manera, se empieza a partir de las integrales de las funciones continuas con soporte compacto. De forma más precisa, las funciones compactamente soportadas forman un espacio vectorial que comporta una topología natural, y se puede definir una medida (Radon) como cualquier funcional lineal continuo de este espacio; entonces el valor de una medida en una función compactamente soportada, es también, por definición, la integral de la función. Entonces se continúa expandiendo la medida (la integral) a funciones más generales por continuidad, y se define la medida de un conjunto como la integral de su función característica. Este es el enfoque que toma Bourbaki[9] y cierto número de otros autores. Para más detalles, véase medidas de Radon.

Otras integrales [editar]

A pesar de que las integrales de Riemann y Lebesgue son las definiciones más importantes de integral, hay unas cuántas más, por ejemplo:

Propiedades de la integración [editar]

Linealidad [editar]

  • El conjunto de las funciones Riemann integrables en un intervalo cerrado [a, b] forman un espacio vectorial con las operaciones de suma (la función suma de otras dos es la función que a cada punto le hace corresponder la suma de las imágenes de este punto por cada una de las otras dos) y la multiplicación por un escalar. La operación integración
 f mapsto int_a^b f ; dx es un funcional lineal de este espacio vectorial. Así, en primer lugar, el conjunto de funciones integrables es cerrado con la combinación lineal, y en segundo lugar, la integral de una combinación lineal es la combinación lineal de las integrales,  int_a^b (alpha f + beta g)(x) , dx = alpha int_a^b f(x) ,dx + beta int_a^b g(x) , dx. ,
  • De forma parecida, el conjunto de las funciones reales Lebesgue integrables en un espacio métrico E dado, con la medida μ es cerrado respecto de las combinaciones lineales y por lo tanto forman un espacio vectorial, y la integral de Lebesgue
 fmapsto int_E f dmu es un funcional lineal de este espacio vectorial, de forma que  int_E (alpha f + beta g) , dmu = alpha int_E f , dmu + beta int_E g , dmu.  fmapstoint_E f dmu, , que es compatible con las combinaciones lineales. En esta situación, la linealidad se sostiene para el subespacio de las funciones, cuya integral es un elemento de V (es decir, las integrales "finitas"). Los casos más importantes surgen cuando K es R, C, o una extensión finita del campo Qp de números p-ádicos, y V es un espacio vectorial de dimensión finita sobre K, y cuando K=C y V es un espacio de Hilbert complejo.

La linealidad, junto con algunas propiedad naturales de continuidad y la normalización para ciertas clases de funciones "simples", se pueden usar para dar una definición alternativa de integral. Este es el enfoque de Daniell para el caso de funciones reales en un conjunto X, generalizado por Bourbaki a funciones que toman valores en un espacio vectorial topológicamente compacto. Véase Hildebrandt (1953)[10] para una caracterización axiomática de la integral.

Desigualdades con integrales [editar]

Se verifican varias desigualdades generales para funciones Riemann integrables definidas en un intervalo cerrado y acotado [a, b] y se pueden generalizar a otras nociones de integral (Lebesgue y Daniell).

  • Cotas superiores e inferiores. Una función f integrable en [a, b], es necesariamente acotada en el intervalo. Por lo tanto hay dos números reales m y M tales que mf (x) ≤ M para todo x de [a, b]. Dado que los sumatorios superior e inferior de f sobre [a, b] son también acotados para m(ba) y M(ba) respectivamente, de aquí resulta que
 m(b - a) leq int_a^b f(x) , dx leq M(b - a).
  • Desigualdades entre funciones. Si f(x) ≤ g(x) para todo x de [a, b] entonces cada uno de los sumatorios superior e inferior de f son acotados inferior y superiormente por los sumatorios superior e inferior de g respectivamente. Así
 int_a^b f(x) , dx leq int_a^b g(x) , dx. Esto es una generalización de las desigualdades anteriores, dado que M '(b a) es la integral de la función constante con valor M en el intervalo [a, b].
  • Subintervalos. Si [c, d] es un subintervalo de [a, b] y f(x) es no negativa para todo x, entonces
 int_c^d f(x) , dx leq int_a^b f(x) , dx.
  • Productos y valores absolutos de funciones. Si f y g son dos funciones, entonces podemos emplear su producto, potencias y valores absolutos:
  (fg)(x)= f(x) g(x), ; f^2 (x) = (f(x))^2, ; |f| (x) = |f(x)|., Si f es Riemann integrable en [a, b] entonces lo mismo se cumple para |f|, y left| int_a^b f(x) , dx right| leq int_a^b | f(x) | , dx. Es más, si f y g son ambas Riemann integrables entonces f 2, g 2, y fg son también Riemann integrables, y left( int_a^b (fg)(x) , dx right)^2 leq left( int_a^b f(x)^2 , dx right) left( int_a^b g(x)^2 , dx right). Esta desigualdad se conoce como desigualdad de Cauchy-Schwarz, y desempeña un papel fundamental en la teoría de los espacios de Hilbert, donde el lado de la derecha se interpreta como el producto escalar de dos funciones integrables f y g en el intervalo [a, b].
  • Desigualdad de Hölder. Si p y q son dos números reales, 1 ≤ p, q ≤ ∞ con 1/p + 1/q = 1, y f y g son dos funciones Riemann integrables. Entonces las funciones |f|p y |g|q también son integrables y se cumple la desigualdad de Hölder:
left|int f(x)g(x),dxright| leq  left(int left|f(x)right|^p,dx right)^{1/p} left(intleft|g(x)right|^q,dxright)^{1/q}. Para el caso de p = q = 2, la desigualdad de Hölder pasa a ser la desigualdad de Cauchy–Schwarz.
  • Desigualdad de Minkowski. Si p ≥ 1 es un número real y f y g son funciones Riemann integrables. Entonces |f|p, |g|p y |f + g|p son también Riemann integrables y se cumple la desigualdad de Minkowski:
left(int left|f(x)+g(x)right|^p,dx right)^{1/p} leq  left(int left|f(x)right|^p,dx right)^{1/p} +  left(int left|g(x)right|^p,dx right)^{1/p}. Una desigualdad análoga a ésta para la integral de Lebesgue se usa en la construcción de los espacios Lp.

Convenciones [editar]

En esta sección f es una función real Riemann integrable. La integral

 int_a^b f(x) , dx

Sobre un intervalo [a, b] está definida si a < b. Esto significa que los sumatorios superiores e inferiores de la función f se evalúan sobre una partición a = x0x1 ≤ . . . ≤ xn = b cuyos valores xi son crecientes. Geométricamente significa que la integración tiene lugar "de izquierda a derecha", evaluando f dentro de intervalos [xi , xi +1] donde el intervalo con un índice más grande queda a la derecha del intervalo con un índice más pequeño. Los valores a y b, los puntos extremos del intervalo, se denominan límites de integración de f. Las integrales también se pueden definir si a > b:

  • Inversión de los límites de integración. si a > b entonces se define
int_a^b f(x) , dx = - int_b^a f(x) , dx.

Ello, con a = b, implica:

  • Integrales sobre intervalos de longitud cero. si a es un número real entonces
int_a^a f(x) , dx = 0.

La primera convención es necesaria al calcular integrales sobre subintervalos de [a, b]; la segunda dice que una integral sobre un intervalo degenerado, o un punto, tiene que ser cero. Un motivo para la primera convención es que la integrabilidad de f sobre un intervalo [a, b] implica que f es integrable sobre cualquier subintervalo [c, d], pero en particular las integrales tienen la propiedad de que:

  • Aditividad de la integración sobre intervalos. si c es cualquier elemento de [a, b], entonces
 int_a^b f(x) , dx = int_a^c f(x) , dx + int_c^b f(x) , dx.

Con la primera convención la relación resultante

begin{align}  int_a^c f(x) , dx &{}= int_a^b f(x) , dx - int_c^b f(x) , dx   &{} = int_a^b f(x) , dx + int_b^c f(x) , dx end{align}

queda bien definida para cualquier permutación cíclica de a, b, y c.

En lugar de ver lo anterior como convenciones, también se puede adoptar el punto de vista de que la integración se hace sólo sobre variedades orientadas. Si M es una tal forma m-dimensional orientada, y M' es la misma forma con orientación opuesta y ω es una m-forma, entonces se tiene (véase más abajo la integración de formas diferenciales):

int_M omega = - int_{M'} omega ,.

Teorema fundamental del cálculo [editar]

El teorema fundamental del cálculo es la afirmación de que la derivación y la integración son operaciones inversas: si una función continua primero se integra y luego se deriva, se recupera la función original. Una consecuencia importante, en ocasiones denominada el segundo teorema fundamental del cálculo, permite calcular integrales a base de emplear una primitiva de la función a integrar.

Enunciado de los teoremas [editar]

  • Teorema fundamental del cálculo. Sea f una función real integrable definida en un intervalo cerrado [a, b]. Si se define F para cada x de [a, b] por
F(x) = int_a^x f(t), dt. entonces F es continua en [a, b]. Si f es continua en x de [a, b], entonces F es derivable en x, y F ′(x) = f(x).
  • Segundo teorema fundamental del cálculo. Sea f una función real, integrable definida en un intervalo cerrado [a, b]. Si F es una función tal que F ′(x) = f(x) para todo x de [a, b] (es decir, F es una primitiva de f), entonces
int_a^b f(t), dt = F(b) - F(a).
  • Corolario. Si f es una función continua en [a, b], entonces f es integrable en [a, b], y F, definida por
F(x) = int_a^x f(t) , dt es una primitiva de f en [a, b]. Además, int_a^b f(t) , dt = F(b) - F(a).

Extensiones [editar]

Integrales impropias [editar]

Artículo principal: Integral impropia
La integral impropia
int_{0}^{infty} frac{dx}{(x+1)sqrt{x}} = pi
tiene intervalos no acotados tanto en el dominio como en el recorrido.

Una integral de Riemann "propia" supone que el integrando está definido y es finito en un intervalo cerrado y acotado, cuyos extremos son los límites de integración. Una integral impropia aparece cuando una o más de estas condiciones no se satisface. En algunos casos, estas integrales se pueden definir tomando el límite de una sucesión de integrales de Riemann propias sobre intervalos sucesivamente más largos.

Si el intervalo no es acotado, por ejemplo en su extremo superior, entonces la integral impropia es el límite cuando el punto final tiende a infinito.

int_{a}^{infty} f(x)dx = lim_{b to infty} int_{a}^{b} f(x)dx

Si el integrando sólo está definido en un intervalo finito semiabierto, por ejemplo (a,b], entonces, otra vez el límite puede suministrar un resultado finito.

int_{a}^{b} f(x)dx = lim_{epsilon to 0} int_{a+epsilon}^{b} f(x)dx

Esto es, la integral impropia es el límite de integrales propias cuando uno de los puntos extremos del intervalo de integración se aproxima, ya sea a un número real especificado, o ∞, o −∞. En casos más complicados, hacen falta límites en los dos puntos extremos o en puntos interiores.

Por ejemplo, la función tfrac{1}{(x+1)sqrt{x}} integrada desde 0 a ∞ (imagen de la derecha). En el extremo inferior, a medida que x se acerca a 0 la función tiende a ∞, y el extremo superior es él mismo ∞, a pesar de que la función tiende a 0. Así, esta es una integral doblemente impropia. Integrada, por ejemplo, desde 1 hasta 3, con un sumatorio de Riemann es suficiente para obtener un resultado de tfrac{pi}{6}. Para integrar desde 1 hasta ∞, un sumatorio de Riemann no es posible. Ahora bien, cualquier límite superior finito, por ejemplo t (con t > 1), da un resultado bien definido, tfrac{pi}{2} - 2arctan tfrac{1}{sqrt{t}}. Este resultado tiene un límite finito cuando t tiende a infinito, que es tfrac{pi}{2}. De forma parecida, la integral desde 13 hasta a 1 admite también un sumatorio de Riemann, que por casualidad da de nuevo tfrac{pi}{6}. Sustituyendo 13 por un valor positivo arbitrario s (con s < 1) resulta igualmente un resultado definido y da -tfrac{pi}{2} + 2arctantfrac{1}{sqrt{s}}. Éste, también tiene un límite finito cuando s tiende a cero, que es tfrac{pi}{2}. Combinando los límites de los dos fragmentos, el resultado de esta integral impropia es

begin{align}  int_{0}^{infty} frac{dx}{(x+1)sqrt{x}} &{} = lim_{s to 0} int_{s}^{1} frac{dx}{(x+1)sqrt{x}}    + lim_{t to infty} int_{1}^{t} frac{dx}{(x+1)sqrt{x}}    &{} = lim_{s to 0} left( - frac{pi}{2} + 2 arctanfrac{1}{sqrt{s}} right)    + lim_{t to infty} left( frac{pi}{2} - 2 arctanfrac{1}{sqrt{t}} right)    &{} = frac{pi}{2} + frac{pi}{2}    &{} = pi . end{align}

Este proceso no tiene el éxito garantizado; un límite puede no existir, o puede ser infinito. Por ejemplo, sobre el intervalo cerrado de 0 a 1 la integral de tfrac{1}{x^2} no converge; y sobre el intervalo abierto del 1 a ∞ la integral de tfrac{1}{sqrt{x}} no converge.

La integral impropia
int_{-1}^{1} frac{dx}{sqrt[3]{x^2}} = 6
no está acotada internamente, pero ambos límites (por la derecha y por la izquierda) existen.

También puede pasar que un integrando no esté acotado en un punto interior, en este caso la integral se ha de partir en este punto, y el límite de las integrales de los dos lados han de existir y han de ser acotados. Así

begin{align}  int_{-1}^{1} frac{dx}{sqrt[3]{x^2}} &{} = lim_{s to 0} int_{-1}^{-s} frac{dx}{sqrt[3]{x^2}}    + lim_{t to 0} int_{t}^{1} frac{dx}{sqrt[3]{x^2}}    &{} = lim_{s to 0} 3(1-sqrt[3]{s}) + lim_{t to 0} 3(1-sqrt[3]{t})    &{} = 3 + 3    &{} = 6. end{align}

A la integral similar

 int_{-1}^{1} frac{dx}{x} ,!

no se le puede asignar un valor de esta forma, dado que las integrales por encima y por debajo de cero no convergen independientemente (en cambio, véase valor principal de Cauchy.)

Integración múltiple [editar]

Artículo principal: Integral múltiple
Integral doble como el volumen limitado por una superficie.

Las integrales se pueden calcular sobre regiones diferentes de los intervalos. En general, una integral sobre un conjunto E de una función f se escribe:

int_E f(x) , dx.

Aquí x no hace falta que sea necesariamente un número real, sino que puede ser cualquier otra cantidad apropiada, por ejemplo, un vector de R3. El teorema de Fubini demuestra que estas integrales pueden reescribirse como una integral iterada. En otras palabras, la integral se puede calcular a base de integrar las coordenadas una por una.

De la misma manera que la integral definida de una función positiva representa el área de la región encerrada entre la gráfica de la función y el eje x, la integral doble de una función positiva de dos variables representa el volumen de la región comprendida entre la superficie definida por la función y el plano que contiene su dominio. (El mismo volumen puede obtenerse a través de una integral triple — la integral de la función de tres variables — de la función constante f(x, y, z) = 1 sobre la región mencionada antes entre la superficie y el plano, lo mismo se puede hacer con una integral doble para calcular una superficie.) Si el número de variables es mayor, entonces la integral representa un hipervolumen, el volumen de un sólido de más de tres dimensiones que no se puede representar gráficamente.

Por ejemplo, el volumen del paralelepípedo de caras 4 × 6 × 5 se puede obtener de dos maneras:

  • Con la integral doble
iint_D 5  dx, dy de la función f(x, y) = 5 calculada en la región D del plano xy que es la base del paralelepípedo.
  • Con la integral triple
iiint_mathrm{paralelepipedo} 1 , dx, dy, dz de la función constante 1 calculada sobre el mismo paralelepípedo (a pesar de que este segundo método también se puede interpretar como el hipervolumen de un hiperparalelepípedo de cuatro dimensiones que tiene como base el paralelepípedo en cuestión y una altura constante de 1, como la altura es 1 el volumen coincide con el área de la base).

Puesto que es imposible calcular la antiderivada de una función de más de una variable, no existen las integrales múltiples indefinidas: tales integrales son todas definidas.

Integrales de línea [editar]

Artículo principal: Integral de línea
Una integral de línea acumula elementos a lo largo de una curva.

El concepto de integral se puede extender a dominios de integración más generales, tales como las líneas curvas y las superficies. Estas integrales se conocen como integrales de línea e integrales de superficie respectivamente. Tienen importantes aplicaciones en la física cuando se trata con campos vectoriales.

Una integral de línea es una integral donde la función a integrar es evaluada a lo largo de una curva. Se utilizan varias integrales curvilíneas diferentes. En el caso de una curva cerrada también se la denomina integral de contorno.

La función a integrar puede ser un campo escalar o un campo vectorial. El valor de la integral curvilínea es la suma de los valores del campo en los puntos de la línea, ponderados por alguna función escalar de la curva (habitualmente la longitud del arco o, en el caso de un campo vectorial, el producto escalar del campo vectorial por un vector diferencial de la curva). Esta ponderación distingue las integrales curvilíneas de las integrales más sencillas definidas sobre intervalos.

Muchas fórmulas sencillas de la física tienen de forma natural análogas continuas en términos de integrales de línea; por ejemplo, el hecho de que el trabajo sea igual a la fuerza multiplicada por la distancia se puede expresar (en términos de cantidades vectoriales) como:

W=vec Fcdotvec d

que tiene su paralelismo en la integral de línea

W=int_C vec Fcdot dvec s

que acumula los componentes vectoriales a lo largo de un camino continuo, y así calcula el trabajo realizado por un objeto al moverse a través de un campo, como por ejemplo un campo eléctrico o un campo gravitatorio.

Integrales de superficie [editar]

Artículo principal: Integral de superficie
La definición de las integrales de superficie descansa en la división de la superficie en pequeños elementos de superficie.

Una integral de superficie es una integral definida calculada sobre una superficie (que puede ser un conjunto curvado en el espacio; se puede entender como la integral doble análoga a la integral de línea. La función a integrar puede ser un campo escalar o un campo vectorial. El valor de la integral de superficie es la suma ponderada de los valores del campo en todos los puntos de la superficie. Esto se puede conseguir a base de dividir la superficie en elementos de superficie, los cuales proporcionan la partición para los sumatorios de Riemann.

Como ejemplo de las aplicaciones de las integrales de superficie, se puede considerar un campo vectorial v sobre una superficie S; es decir, para cada punto x de S, v(x) es un vector. Imagínese que se tiene un fluido fluyendo a través de S, de forma que v(x) determina la velocidad del fluido en el punto x. El caudal se define como la cantidad de fluido que fluye a través de S en la unidad de tiempo. Para hallar el caudal, hay que calcular el producto escalar de v por el vector unitario normal a la superficie S en cada punto, lo que nos dará un campo escalar, que integramos sobre la superficie:

int_S {mathbf v}cdot ,d{mathbf {S}}.

El caudal de fluido de este ejemplo puede ser de un fluido físico como el agua o el aire, o de un flujo eléctrico o magnético. Así, las integrales de superficie tienen aplicaciones en la física, en particular en la teoría clásica del electromagnetismo.

Integrales de formas diferenciales [editar]

Artículo principal: Forma diferencial

Una forma diferencial es un concepto matemático en los campos del cálculo multivariable, topología diferencial y tensores. La notación moderna de las formas diferenciales, así como la idea de las formas diferenciales como el producto exterior de derivadas exteriores formando un álgebra exterior, fue presentada por Élie Cartan.

Se empieza trabajando en un conjunto abierto de Rn. Una 0-forma se define como una función infinitamente derivable f. Cuando se integra una función f sobre un subespacio de m-dimensional S de Rn, se escribe como

int_S f,dx^1 cdots dx^m.

(Los superíndices no son exponentes.) Se puede considerar que dx1 hasta dxn son objetos formales ellos mismos, más que etiquetas añadidas para hacer que la integral se asemeje a los sumatorios de Riemann. De forma alternativa se pueden ver como covectores, y por lo tanto como una medida de la "densidad" (integrable en un sentido general). A dx1, …,dxn se las denomina 1-formas básicas.

Se define el conjunto de todos estos productos como las 2-formas básicas, y de forma similar se define el conjunto de los productos de la forma dxadxbdxc como las 3-formas básicas. Una k-forma general es por lo tanto una suma ponderada de k-formas básicas, donde los pesos son las funciones infinitamente derivables f. Todas juntas forman un espacio vectorial, siendo las k-formas básicas los vectores base, y las 0-formas (funciones infinitamente derivables) el campo de escalares. El producto exterior se extiende a las k-formas de la forma natural. Sobre Rn como máximo n covectores pueden ser linealmente independientes, y así una k-forma con k > n será siempre cero por la propiedad alternante.

Además del producto exterior, también existe el operador derivada exterior d. Este operador hace corresponder a las k-formas (k+1)-formas. Para una k-forma ω = f dxa sobre Rn, se define la acción de d por:

{bold d}{omega} = sum_{i=1}^n frac{partial f}{partial x_i} dx^i wedge dx^a.

con extensión a las k-formas generales que se dan linealmente.

Este planteamiento más general permite un enfoque de la integración sobre variedades libre de coordenadas. También permite una generalización natural del teorema fundamental del cálculo, denominada teorema de Stokes, que se puede establecer como

int_{Omega} {bold d}omega = int_{partialOmega} omega ,!

donde ω es una k-forma general, y ∂Ω indica la frontera de la región Ω. Así en el supuesto de que ω sea una 0-forma y Ω sea un intervalo cerrado de la recta real, el teorema de Stokes se reduce al teorema fundamental del cálculo. En el caso de que ω sea una 1-forma y Ω sea una región de dimensión 2 en el plano, el teorema se reduce al teorema de Green. De manera similar, empleando 2-formas, 3-formas y la dualidad de Hodge, se puede llegar al teorema de Stokes y al teorema de la divergencia. De esta forma puede verse que las formas diferenciales suministran una potente visión unificadora de la integración.

Métodos y aplicaciones [editar]

Cálculo de integrales [editar]

Artículo principal: Métodos de integración

La técnica más básica para calcular integrales de una variable real se basa en el teorema fundamental del cálculo. Se procede de la siguiente forma:

  1. Se escoge una función f(x) y un intervalo [a, b].
  2. Se halla una primitiva de f, es decir, una función F tal que F' = f.
  3. Se emplea el teorema fundamental del cálculo, suponiendo que ni el integrando ni la integral tienen singularidades en el camino de integración, int_a^b f(x),dx = F(b)-F(a).
  4. Por tanto, el valor de la integral es F(b) − F(a).

Nótese que la integral no es realmente la primitiva, sino que el teorema fundamental permite emplear las primitivas para evaluar las integrales definidas.

A menudo, el paso difícil de este proceso es el de encontrar una primitiva de f. En raras ocasiones es posible echar un vistazo a una función y escribir directamente su primitiva. Muy a menudo, es necesario emplear una de las muchas técnicas que se han desarrollado para evaluar integrales. La mayoría de ellas transforman una integral en otra que se espera que sea más manejable. Entre estas técnicas destacan:

Incluso si estas técnicas fallan, aún puede ser posible evaluar una integral dada. La siguiente técnica más común es el cálculo del residuo, mientras que la serie de Taylor a veces se puede usar para hallar la primitiva de las integrales no elementales en lo que se conoce como el método de integración por series. También hay muchas formas menos habituales para calcular integrales definidas; por ejemplo, se puede emplear la identidad de Parseval para transformar una integral sobre una región rectangular en una suma infinita. En algunas ocasiones, se puede evaluar una integral empleando un truco; un ejemplo de este tipo se puede ver en la integral de Gauss.

Los cálculos de volúmenes de sólidos de revolución se pueden hacer normalmente con la integración por discos o la integración por capas.

Los resultados específicos que se han encontrado empleando las diferentes técnicas se recogen en la tabla de integrales.

Algoritmos simbólicos [editar]

Artículo principal: Integración simbólica

En muchos problemas de matemáticas, física, e ingeniería en los que participa la integración es deseable tener una fórmula explícita para la integral. Con esta finalidad, a lo largo de los años se han ido publicando extensas tablas de integrales. Con el desarrollo de los ordenadores, muchos profesionales, educadores y estudiantes han recurrido a los sistemas de cálculo algebraico por ordenador, que han sido diseñados específicamente para desarrollar tareas tediosas o difíciles, entre las cuales se encuentra la integración. La integración simbólica presenta un reto especial en el desarrollo de este tipo de sistemas.

Una dificultad matemática importante de la integración simbólica es que, en muchos casos, no existe ninguna fórmula cerrada para la primitiva de una función aparentemente inocente. Por ejemplo, se sabe que las primitivas de las funciones exp (x2), xx y sen x /x no se pueden expresar con una fórmula cerrada en las que participen sólo funciones racionales, exponenciales, logarítmicas, trigonométricas, inversas de las funciones trigonométricas, y las operaciones de suma, multiplicación y composición. En otras palabras, ninguna de estas tres funciones dadas es integrable con funciones elementales. La teoría de Galois diferencial proporciona criterios generales para determinar cuándo la primitiva de una función elemental es a su vez elemental. Por desgracia, resulta que las funciones con expresiones cerradas para sus primitivas son la excepción en vez de ser la regla. En consecuencia, los sistemas de cálculo algebraico por ordenador, no pueden tener la seguridad de poder encontrar una primitiva para una función elemental cualquiera construida de forma aleatoria. En el lado positivo, si se fijan de antemano los "bloques constructivos" de las primitivas, aún es posible decidir si se puede expresar la primitiva de una función dada empleando estos bloques y las operaciones de multiplicación y composición, y hallar la respuesta simbólica en el caso de que exista. El algoritmo de Risch, implementado en Mathematica y en otros sistemas de cálculo algebraico por ordenador, hacen precisamente esto para funciones y primitivas construidas a partir de fracciones racionales, radicales, logaritmos y funciones exponenciales.

Algunos integrandos aparecen con la suficiente frecuencia como para merecer un estudio especial. En particular, puede ser útil tener, en el conjunto de las primitivas, las funciones especiales de la física (como las funciones de Legendre, la función hipergeométrica, la función gamma, etcétera). Es posible extender el algoritmo de Risch-Norman de forma que abarque estas funciones, pero se trata de todo un reto.

La mayoría de los humanos no son capaces de integrar estas fórmulas generales, por lo que en cierto sentido los ordenadores son más hábiles integrando fórmulas muy complicadas. Es poco probable que las fórmulas muy complejas tengan primitivas de forma cerrada, de modo que hasta qué punto esto es una ventaja es una cuestión filosófica abierta a debate.

Cuadratura numérica [editar]

Métodos numéricos de cuadratura:  Rectángulo,  Trapezoide,  Romberg,  Gauss.
Artículo principal: Integración numérica

Las integrales que se encuentran en los cursos básicos de cálculo han sido elegidas deliberadamente por su simplicidad, pero las que se encuentran en las aplicaciones reales no siempre son tan asequibles. Algunas integrales no se pueden hallar con exactitud, otras necesitan de funciones especiales que son muy complicadas de calcular, y otras son tan complejas que encontrar la respuesta exacta es demasiado lento. Esto motiva el estudio y la aplicación de métodos numéricos para aproximar integrales. Hoy en día se usan en la aritmética de coma flotante, en ordenadores electrónicos. Para los cálculos a mano surgieron muchas ideas mucho antes; pero la velocidad de los ordenadores de uso general como el ENIAC crearon la necesidad de mejoras.

Los objetivos de la integración numérica son la exactitud, la fiabilidad, la eficiencia y la generalidad. Por ejemplo, la integral

int_{-2}^{2} tfrac15 left( tfrac{1}{100}(322 + 3 x (98 + x (37 + x))) - 24 frac{x}{1+x^2} right) dx

que tiene el valor aproximado de 6.826 (en la práctica ordinaria no se conoce de antemano la respuesta, por lo que una tarea importante — que no se explora aquí — es decidir en qué momento una aproximación ya es bastante buena.) Un enfoque de "libro de cálculo" divide el intervalo de integración en, por ejemplo, 16 trozos iguales, y calcula los valores de la función.

Valores de la función en los puntos
x−2,00−1,50−1,00−0,50 0,00 0,50 1,00 1,50 2,00
f(x) 2,22800 2,45663 2,67200 2,32475 0,64400−0,92575−0,94000−0,16963 0,83600
x −1.75−1,25−0,75−0,25 0,25 0,75 1,25 1.75
f(x) 2,33041 2,58562 2,62934 1,64019−0,32444−1,09159−0,60387 0,31734

Referencias y notas [editar]

  1. En el caso de las funciones a las que se aplica la definición de Riemann, los resultados coinciden
  2. Burton, David M. (2005). The History of Mathematics: An Introduction (6ª ed.), McGraw-Hill, p. 359, ISBN 978-0-07-305189-5
  3. Leibniz, Gottfried Wilhelm (1899) (Gerhardt, Karl Immanuel, ed.). Der Briefwechsel von Gottfried Wilhelm Leibniz mit Mathematikern. Erster Band, Berlin: Mayer & Müller, p. 154
  4. Cajori, Florian (1929). A History Of Mathematical Notations, Vol. II, Open Court Publishing, pp. 247–252, ISBN 978-0-486-67766-8
  5. Fourier, Jean Baptiste Joseph (1822). Théorie analytique de la chaleur, Chez Firmin Didot, père et fils, p. §231, [1]
  6. W3C (2006). Arabic mathematical notation [2]
  7. Rudin, Walter (1987). "Chapter 1: Abstract Integration", Real and Complex Analysis (International ed.), McGraw-Hill, ISBN 978-0-07-100276-9
  8. Folland, Gerald B. (1984). Real Analysis: Modern Techniques and Their Applications (1ª ed.), John Wiley & Sons, ISBN 978-0-471-80958-6
  9. Bourbaki, Nicolas (2004). Integration I, Springer Verlag, ISBN 3-540-41129-1. En particular, los capítulos III y IV.
  10. Hildebrandt, T. H. (1953). "Integration in abstract spaces", Bulletin of the American Mathematical Society 59(2): 111–139, ISSN 0273-0979 [3]

Bibliografia [editar]

Véase también [editar]

Enlaces externos [editar]


Libros online [editar]

04/05/2010 11:28 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: DERIVADAS. PERMITEN HACER APROXIMACIONES A UN PUNTO. TIENEN POR TANTO MUCHAS APLICACIONES EN GEOMETRÍA Y CÁLCULO DIFERENCIAL (HACIA DÓNDE TIENDE LA LÍNEA). En cálculo (rama de las matemáticas), la derivada representa cómo una función cambia a medida que su entrada cambia. En términos poco rigurosos, una derivada puede ser vista como cuánto está cambiando el valor de una cantidad en un punto dado; por ejemplo, la derivada de la posición de un vehículo con respecto al tiempo es la velocidad instantánea con la cual el vehículo está viajando. La derivada de una función en un valor de entrada dado describe la mejor aproximación lineal de una función cerca del valor de entrada.

Derivada

De Wikipedia, la enciclopedia libre

En cálculo (rama de las matemáticas), la derivada representa cómo una función cambia a medida que su entrada cambia. En términos poco rigurosos, una derivada puede ser vista como cuánto está cambiando el valor de una cantidad en un punto dado; por ejemplo, la derivada de la posición de un vehículo con respecto al tiempo es la velocidad instantánea con la cual el vehículo está viajando.

La derivada de una función en un valor de entrada dado describe la mejor aproximación lineal de una función cerca del valor de entrada. Para funciones de valores reales de una sola variable, la derivada en un punto representa el valor de la pendiente de la recta tangente en la gráfica de la función en dicho punto. En dimensiones más elevadas, la derivada de una función en un punto es la transformación lineal que más se aproxima a la función en valores cercanos de ese punto. Algo estrechamente relacionado es el diferencial de una función.

El proceso de encontrar una derivada es llamado diferenciación. El teorema fundamental del cálculo dice que la diferenciación es el proceso inverso de la integración en funciones continuas.

La derivada de la función en el punto marcado equivale a la pendiente de la recta tangente (la gráfica de la función está dibujada en negro; la tangente a la curva está dibujada en rojo).

Contenido

[ocultar]

Conceptos y aplicaciones [editar]

El concepto de derivada es uno de los dos conceptos centrales del cálculo infinitesimal. El otro concepto es la "antiderivada" o integral; ambos están relacionados por el teorema fundamental del cálculo. A su vez, los dos conceptos centrales del cálculo están basados en el concepto de límite, el cual separa las matemáticas previas, como el Álgebra, la Trigonometría o la Geometría Analítica, del Cálculo. Quizá la derivada es el concepto más importante del Cálculo Infinitesimal.

La derivada es un concepto que tiene variadas aplicaciones. Se aplica en aquellos casos donde es necesario medir la rapidez con que se produce el cambio de una magnitud o situación. Es una herramienta de cálculo fundamental en los estudios de Física, Química y Biología, o en ciencias sociales como la Economía y la Sociología. Por ejemplo, cuando se refiere a la gráfica de dos dimensiones de f, se considera la derivada como la pendiente de la recta tangente del gráfico en el punto x. Se puede aproximar la pendiente de esta tangente como el límite cuando la distancia entre los dos puntos que determinan una recta secante tiende a cero, es decir, se transforma la recta secante en una recta tangente. Con esta interpretación, pueden determinarse muchas propiedades geométricas de los gráficos de funciones, tales como concavidad o convexidad.

Algunas funciones no tienen derivada en todos o en alguno de sus puntos. Por ejemplo, una función no tiene derivada en los puntos en que se tiene una tangente vertical, una discontinuidad o un punto anguloso. Afortunadamente, gran cantidad de las funciones que se consideran en las aplicaciones son continuas y su gráfica es una curva suave, por lo que es susceptible de derivación.

Las funciones que son diferenciables (derivables si se habla en una sola variable), son aproximables linealmente.

Introducción geométrica a las derivadas [editar]

La derivada de la función en el punto marcado equivale a la pendiente de la recta tangente (la gráfica de la función está dibujada en negro; la tangente a la curva está dibujada en rojo).

Supongamos que tenemos una función y la llamamos f,. La derivada de f, es otra función que llamaremos f',.

f'(x), representa la pendiente de la recta tangente a la gráfica de f, en el punto x,.

En términos geométricos, esta pendiente f'(x), es "la inclinación" de la línea recta que pasa justo por encima del punto (x, f(x)), y que es tangente a la gráfica de f,.

Al identificar dos puntos muy cercanos en la gráfica y al unirlos mediante una línea recta, una pendiente queda visualizada. Cuanto más cercanos sean los dos puntos que se unen por medio de la recta, la recta se parece más a una recta tangente a la gráfica y su pendiente se parece más a la pendiente de una recta tangente.

Notamos que esta pendiente coincide con la rapidez con que aumenta el valor de la función en cada punto. Dicho de otra manera, si la pendiente en un punto es muy grande, entonces el valor de la función en ese punto crece muy deprisa; si la pendiente es muy pequeña, entonces el valor de la función crece muy despacio en ese punto.

Es decir, tanto la pendiente de la recta tangente como la rapidez de crecimiento en un punto x, de una función f, está dado por f'(x),.

Lamentablemente no todas las funciones poseen derivada, desde el punto de vista geométrico esto se puede deber a varias cosas: por ejemplo hay funciones donde se da el caso de que por un mismo punto pasan muchas rectas tangentes(por ejemplo la función valor absoluto en el punto 0) y no es posible definir de manera única la pendiente a la recta tangente; también se da el caso de que no se puede definir la pendiente a una recta tangente en una función que no es continua; incluso hay funciones donde cualquier recta que pase por uno de sus puntos intersecta en una infinidad de puntos muy cercanos y por tanto no hay recta tangente.

Las funciones que poseen derivada se llaman diferenciables.

Conocer la derivada de una función diferenciable por lo general resulta una tarea sencilla utilizando las técnicas de derivación desarrolladas por Gottfried Leibniz e Isaac Newton, las cuales permiten conocer las derivadas de muchas de las funciones de interés frecuente o bien, simplificar el trabajo para encontrar derivadas menos comunes.

Condiciones de continuidad de una función [editar]

Una función continua es aquella cuya regla de correspondencia asigna incrementos pequeños en la variable dependiente a pequeños incrementos de los elementos del dominio de dicha función, es decir,  lim_{Delta x to 0}Delta y=0, y usando la expresión Δy + y = fx + x), queda  lim_{Delta x to 0}f(Delta x +x)-y=0 donde en este caso, f(x) = y. Ello quiere decir que lim_{x to a}f_{(x)}=f_{(a)}, y si este último límite existe significa en consecuencia por un teorema de límites (un límite existe si y sólo si los dos límites laterales existen y son iguales) que toda función f(x) que cumpla con

 lim_{x to a+}f(x)= lim_{x to a-}f(x)=lim_{x to a}f(x)=f(a) es continua en el punto a.

Condición no recíproca [editar]

La relación no funciona a la inversa: el que una función sea continua no garantiza su derivabilidad. Es posible que los límites laterales sean equivalentes pero las derivadas laterales no; en este caso la función presenta un punto anguloso en dicho punto.

Un ejemplo puede ser la función valor absoluto (también llamada módulo) en el punto (0,0) ,. Dicha función es equivalente a la función partida left{begin{matrix} x, & mbox{si }xge 0  -x, & mbox{si }x<0 end{matrix}right.

Para valores infinitamente cercanos a 0, por ambas ramas, el resultado tiende a 0. Y el resultado en el punto 0 es también 0, por lo tanto es continua. Sin embargo, las derivadas resultan left{begin{matrix} 1, & mbox{si }x> 0  -1, & mbox{si }x<0 end{matrix}right.

Cuando x , vale 0, las derivadas laterales dan resultados diferentes. Por lo tanto, no existe derivada en el punto, a pesar de que sea continuo.

De manera informal, si el gráfico de la función tiene puntas agudas, se interrumpe o tiene saltos, no es derivable.

Definición analítica de derivada como un límite [editar]

Esquema que muestra los incrementos de la función en x y en y.

En terminología clásica, diferenciación manifiesta el coeficiente en que una cantidad y, cambia a consecuencia de un cambio en otra cantidad x,.

En matemáticas coeficiente es un factor multiplicativo que pertenece a cierto objeto como una variable, un vector unitario, una función base, etc.

En física coeficiente es una expresión numérica que mediante alguna fórmula determina las características o propiedades de un cuerpo.

En nuestro caso, observando la gráfica de la derecha, el coeficiente del que hablamos vendría representado en el punto P, de la función por el resultado de la división representada por la relación frac{dx}{dy}, que como puede comprobarse en la gráfica, es un valor que se mantiene constante a lo largo de la línea recta azul que representa la tangente en el punto P, de la función. Esto es fácil de entender puesto que el triangulo rectangulo formado en la gráfica con vertice en el punto P,, por mucho que lo dibujemos más grande, al ser una figura proporcional el resultado de frac{dx}{dy} es siempre el mismo.

Esta noción constituye la aproximación más veloz a la derivada, puesto que el acercamiento a la pendiente de la recta tangente es tanto por la derecha como por la izquierda de manera simultánea.

En particular, se tiene que la derivada de la función en el punto a, se define como sigue:


f'(a)=lim_{hrightarrow0} frac{f(a + h) - f(a)}{h},

Si este límite existe, de lo contrario, f' no está definida. Esta última expresión coincide con la velocidad instantánea del movimiento continuo uniforme acelerado en cinemática.

Aunque podrían calcularse todas las derivadas empleando la definición de derivada como un límite, existen reglas bien establecidas, conocidas como teoremas para el cálculo de derivadas, las cuales permiten calcular la derivada de muchas funciones de acuerdo a su forma sin tener que calcular forzosamente el límite. Tales reglas son consecuencia directa de la definición de derivada y de reglas previas, como puede apreciarse en todo buen texto de cálculo infinitesimal.

También puede definirse alternativamente la derivada de una función en cualquier punto de su dominio de la siguiente manera:

f'(a)=lim_{xrightarrow a} frac{f(x) - f(a)}{x - a},

La cual representa un acercamiento de la pendiente de la secante a la pendiente de la tangente ya sea por la derecha o por la izquierda según el signo de a,. El aspecto de este límite está relacionado más con la velocidad instantánea del movimiento uniformemente acelerado que con la pendiente de la recta tangente a una curva.

No obstante su aparente diferencia, el cálculo de la derivada por definición con cualquiera de los límites anteriormente expresados, proporciona siempre el mismo resultado.

El conocimiento de todas las expresiones anteriores y su significado representan el acercamiento epistémico más completo posible en torno a la definición de derivada, y con ello, al aspecto esencial del cálculo diferencial.

Notación [editar]

Existen diversas formas para nombrar a la derivada. Si f es una función, se escribe la derivada de la función f, respecto al valor x, en varios modos:

se lee "efe prima de equis"

se lee "d, sub x, de f,", y los símbolos D y d deben entenderse como operadores.

se lee "punto x," o "x, punto". Actualmente está en desuso en Matemáticas puras, sin embargo se sigue usando en áreas de la física como la mecánica, donde otras notaciones de la derivada se pueden confundir con la notación de velocidad relativa. Se usa para definir la derivada temporal de una variable.

se lee "derivada de y, (f, ó f, de x,) con respecto a x,". Esta notación tiene la ventaja de sugerir a la derivada de una función con respecto a otra como un cociente de diferenciales.

La notación más simple para diferenciación, en uso actual, es debida a Lagrange. Para identificar las derivadas de f, en el punto a, se escribe:

f^prime(a) para la primera derivada, f^{primeprime}(a) para la segunda derivada, f^{primeprimeprime}(a) para la tercera derivada, f^{(n)}(a), para la enésima derivada (n > 3). (También se pueden usar números romanos).

Para la función derivada de f, en x,, se escribe f^prime(x),. De modo parecido, para la segunda derivada de f, en x,, se escribe f^{primeprime}(x),, y así sucesivamente.

La otra notación común para la diferenciación es debida a Leibniz. Para la función derivada de f,, se escribe:

frac{mathrm dleft(f(x)right)}{mathrm dx}.

Con esta notación, se puede escribir la derivada de f en el punto a de dos modos diferentes:

frac{mathrm dleft(f(x)right)}{mathrm dx}left.{!!frac{}{}}right|_{x=a} = left(frac{mathrm dleft(f(x)right)}{mathrm dx}right)(a).

Si y=f(x),, se puede escribir la derivada como

mathrm dy over mathrm dx

Las derivadas sucesivas se expresan como

frac{mathrm d^nleft(f(x)right)}{mathrm dx^n} o frac{mathrm d^ny}{mathrm dx^n}

para la enésima derivada de f, o de y respectivamente. Históricamente, esto viene del hecho que, por ejemplo, la tercera derivada es

frac{mathrm d left(frac{mathrm d left( frac{mathrm d left(f(x)right)} {mathrm dx}right)} {mathrm dx}right)} {mathrm dx}

la cual se puede escribir como

left(frac{mathrm d}{mathrm dx}right)^3 left(f(x)right) = frac{mathrm d^3}{left(mathrm dxright)^3} left(f(x)right).

La notación de Leibniz es muy útil, por cuanto permite especificar la variable de diferenciación (en el denominador); lo cual es pertinente en caso de diferenciación parcial. También facilita recordar la regla de la cadena, porque los términos "d" parecen cancelarse simbólicamente:

frac{mathrm dy}{mathrm dx} = frac{mathrm dy}{mathrm du} cdot frac{mathrm du}{mathrm dx}.

En la formulación popular del cálculo mediante límites, los términos "d" no pueden cancelarse literalmente, porque por sí mismos son indefinidos; son definidos solamente cuando se usan juntos para expresar una derivada. En análisis no-estándar, no obstante, se puede ver como números infinitesimales que se cancelan.

La notación de Newton para la diferenciación respecto al tiempo, era poner un punto arriba del nombre de la función:

dot{x} = frac{mathrm dx}{mathrm dt} = x^prime(t) ddot{x} = x^{primeprime}(t)

y así sucesivamente.

Esta notación de Newton se usa principalmente en mecánica, normalmente para derivadas de tiempo tales comos velocidad y aceleración, y en teoría de ecuaciones diferenciales ordinarias. Usualmente solo se usa para las primeras y segundas derivadas.

Diferenciabilidad [editar]

Una función con dominio en un subconjunto de los reales es diferenciable en un punto x si su derivada existe en ese punto; una función es diferenciable en un intervalo si es diferenciable en todos los puntos del intervalo.

Si una función es diferenciable en un punto x, la función es continua en ese punto. Sin embargo, una función continua en x, puede no ser diferenciable en dicho punto. En otras palabras, diferenciabilidad implica continuidad, pero no su recíproco.

La derivada de una función diferenciable puede ser, a su vez, diferenciable. La derivada de una primera derivada se llama derivada segunda. De un modo parecido. La derivada de una derivada segunda es la derivada tercera, y así sucesivamente. Esto también recibe el nombre de derivación sucesiva o derivadas de orden superior.

Cociente de diferencias de Newton [editar]

Derivative.png

La derivada de una función f, es la pendiente geométrica de la línea tangente del gráfico de f, en x,. Sin el concepto que se va a definir, no es posible encontrar directamente la pendiente de la línea tangente a una función dada, porque solamente se conoce un punto en la línea tangente: (x,f(x)),. La idea es aproximar la línea tangente con múltiples líneas secantes que tienen distancias progresivamente más pequeñas entre los dos puntos que cruzan. Cuando se toma el límite de las pendientes de las líneas secantes de esta progresión, se consigue la pendiente de la línea tangente. Se define, pues, la derivada tomando el límite de la pendiente de las líneas secantes, al acercarlas a la línea tangente.

Para encontrar las pendientes de las líneas secantes próximas, se elige un número relativamente pequeño h,. h, representa un cambio relativamente pequeño en x,, y puede ser positivo o negativo. La pendiente de la línea que cruza los dos puntos  ( x, f(x) ) , y  ( x+h, f(x+h) ) , es

f(x + h) - f(x) over h .
Inclinación de la secante de la curva y=f(x).

Esta expresión es el cociente de diferencias de Newton. La derivada de f en x es el límite del valor del cociente diferencial, conforme las líneas secantes se aproximan a la línea tangente:

displaystyle f^prime(x) = lim_{h to 0} {f(x + h) - f(x) over h}.

Si la derivada de f , existe en todos los puntos x ,, se puede definir la derivada de f , como la función cuyo valor en cada punto x , es la derivada de f , en x ,.

Puesto que sustituir h , por 0 produce una división por cero, calcular directamente la derivada puede no ser intuitivo. Una técnica posible consiste en operar en el numerador, de manera que se puede cancelar la h , del denominador. Y eso es posible fácilmente en los polinomios. Pero para muchas otras funciones el resultado es incierto. Afortunadamente, hay reglas generales que facilitan diferenciar la mayoría de las funciones simples.


Sea f , una función continua, y C , su curva. Sea x=a , la abscisa de un punto regular, es decir donde C , no hace un ángulo. En el punto A(a,f(a)) , de C , se puede trazar la tangente a la curva. Su coeficiente director, o sea su pendiente, es f^prime(a), el número derivado de f , en a ,.

La función arightarrow f^prime(a) es la derivada de f ,.

Pendiente.png

En el punto de contacto, conociendo la pendiente de la tangente, es decir f^prime(a), se puede saber a qué ritmo crece o decrece la función. El signo de f^prime(a) determina en función f , (si crece o no).

Derivada.png

En este gráfico se ve que donde f , es creciente, las tangentes apuntan hacia arriba (mirando de izquierda a derecha), y por lo tanto f^prime , es positiva, como en el punto D , (x=d ,), mientras que donde f , es decreciente, las tangentes apuntan hacia abajo y f^prime es negativa, como en el punto B , (x=b ,). En los puntos A , y C ,, que son máximo y mínimo local, la tangente es horizontal, luego f^prime(a)=0=f^prime(c).

La función derivada se puede calcular sin dibujar la curva de f. En efecto, gracias a una propiedad geométrica de la tangente, se tiene la fórmula:

f^prime(x) = lim_{h to 0} frac {f(x+h) -  f(x)} {h}

Por ejemplo, sea

 fleft(xright) = x^2

entonces:

 begin{array}{rcl}  f^prime(x) &=& displaystyle lim_{h to 0} frac{f(x+h) - f(x)}{h}  &=& displaystyle lim_{h to 0} frac{(x+h)^2 -x^2}{h}  &=& displaystyle lim_{h to 0} frac{x^2 + 2xh + h^2 - x^2}{h}  &=& displaystyle lim_{h to 0} frac{2xh + h^2}{h}  &=& displaystyle lim_{h to 0} (2x + h)  &=& 2x end{array}

Lista de derivadas de funciones elementales [editar]

Artículo principal: Anexo:Tabla de derivadas
fleft(xright) = af'left(xright) = 0
fleft(xright) = xf'left(xright) = 1
fleft(xright) = axf'left(xright) = a
fleft(xright) = ax + bf'left(xright) = a
fleft(xright) = x^nf'left(xright) = nx^{n-1}
fleft(xright) = sqrt{x}f'left(xright) = frac{1}{2sqrt{x}}
fleft(xright) = e^xf'left(xright) = e^x
fleft(xright) = ln(x)f'left(xright) = frac{1}{x}
fleft(xright) = a^x (a >0)f'left(xright) = a^x ln(a)
fleft(xright) = log_{b}(x)f'left(xright) = frac{1}{xln(b)}
fleft(xright) = frac{1}{x^n} = (x^n)^{-1} = x^{-n}f'left(xright) = -nx^{-n-1} = -nx^{-(n+1)} = frac{-n}{x^{n+1}}
fleft(xright) = operatorname{sen}(x)f'left(xright) = cos(x)
fleft(xright) = cos(x)f'left(xright) = -operatorname{sen}(x)
fleft(xright) = tan(x)f'left(xright)=sec^2(x)=frac{1}{cos^2(x)}=1+tan^2(x)
fleft(xright) = csc(x)f'left(xright) = -csc(x)cot(x)
fleft(xright) = sec(x)f'left(xright) = sec(x)tan(x)
fleft(xright) = cot(x)f'left(xright) = -csc^2(x)
fleft(xright) = operatorname{arcsen}(x)f'left(xright) = frac{1}{sqrt{1-x^2}}
fleft(xright) = arccos(x)f'left(xright) = frac{-1}{sqrt{1-x^2}}
fleft(xright) = arctan(x)f'left(xright) = frac{1}{1+x^2}
fleft(xright) = g(x) pm h(x)f'left(xright) = g'(x) pm h'(x)
fleft(xright) = g(x) cdot h(x)f'left(xright) = g'(x) cdot h(x) + g(x) cdot h'(x)
fleft(xright) = frac{g(x)}{h(x)}f'left(xright) = frac{g'(x) cdot h(x) - g(x) cdot h'(x)}{h^2(x)}
fleft(xright) = k cdot g(x)f'left(xright) = k cdot g'(x)
fleft(xright) = g circ h = g(h(x))f'left(xright) = (g'circ h) cdot h' = g'(h(x)) cdot h'(x)

Ejemplo [editar]

Sea f , la función f(x)=2x^3-9x^2-24x+51 ,, definida sobre el conjunto de los números reales (denotado por mathbb R ,). Para conocer sus variaciones se observa su derivada:

f^prime(x)=6x^2-18x-24

Para encontrar el signo de f^prime(x), se tiene que factorizar:

begin{array}{rcl}f^prime(x)&=&6(x^2-3x-4)&=&6(x+1)(x-4)end{array}

lo anterior que se hace resolviendo una ecuación de segundo grado.

También se observa su segunda derivada:

f''(x) = 12x − 18

Dado que f'(-1)=0, y f''(-1)<0, entonces f, tiene un máximo local en -1 y su valor es f(-1)=64,.

Dado que f'(4)=0, y f''(4)>0, entonces f, tiene un mínimo local en 4 y su valor es f(4)=-61,.

Nótese que la derivada es diferenciable en todo su dominio y hay exactamente 2 valores de x tales que f'(x)=0,, los cuales son x=-1, y x=4,, tomando en cuenta el teorema del valor medio y que f''(-1)<0, entonces la derivada es negativa en el intervalo (-1, 4), por lo tanto la función es decreciente en el intervalo [-1, 4],.

Al ser una función basada en un polinomio cúbico no está acotada ni por arriba ni por abajo y como su derivada es una función cuadrática entonces no tiene más de 2 puntos con derivada igual a cero, por tanto la función es creciente en el intervalo [4, infty), y en el intervalo (-infty, -1],.

Generalizaciones [editar]

El concepto simple de derivada de una función real de una sola variable ha sido generalizado de varias maneras:

Véase también [editar]

04/05/2010 11:22 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: LÍMITE DE UNA FUNCIÓN. AVERIGUO SI ESA FUNCIÓN ES CONTINUA O LINEAL Y LUEGO TRATO DE SABER SI NO LO ES, HACIA DONDE SE APROXIMAN ESA SECUENCIA DE PUNTOS A TRAVÉS DE LAS DIFERENCIALES O DERIVDAS. El límite de una función es un concepto fundamental del cálculo diferencial matemático.

Límite de una función

De Wikipedia, la enciclopedia libre

El límite de una función es un concepto fundamental del cálculo diferencial matemático.

Informalmente, el hecho que una función f tiene un límite L en el punto p, significa que el valor de f puede ser tan cercano a L como se desee, tomando puntos suficientemente cercanos a p, pero distintos de p.

Contenido

[ocultar]

Historia [editar]

Aunque implícita en el desarrollo del Calculo de los siglos XVII y XVIII, la notación moderna del límite de una función se remonta a Bolzano quien, en 1817, introdujo las bases de la técnica épsilon-delta.[1] Sin embargo, su trabajo no fue conocido mientras él estuvo vivo. Cauchy expuso límites en su Cours d'analyse (1821) y parece haber expresado la esencia de la idea, pero no en una manera sistemática.[2] La primera presentación rigurosa de la técnica hecha pública fue dada por Weierstrass en los 1850 y 1860[3] y desde entonces se ha convertido en el método estándar para trabajar con límites.

La notación de escritura usando la abreviatura lim con la flecha debajo es debido a Hardy en su libro A Course of Pure Mathematics en 1908.[2]

Definición formal [editar]

Funciones en espacios métricos [editar]

Visualización de los parámetros utilizados en la definición de límite.
    begin{array}{l}       underset {xto p}{lim} , , f(x) = L iff                forall varepsilon > 0   exists delta > 0 :            forall x(0<|x-p|<delta longrightarrow |f(x)-L|<epsilon)    end{array}

El límite de la función f(x) cuando x se aproxima a p será L si y solo sí para todo ε > 0 existe un δ > 0 tal que para todo número real x en 0 < |x - p| < δ, tenemos que |f(x) - L| < ε

El siguiente concepto de límite es el de la definición formal, la cual no es muy aprensible para el común de la gente. Dicha formulación matemática es más conocida como epsilon - delta. Por ello es importante entender el concepto de límite como aquella herramienta matemática que sirve para conocer el comportamiento de una función alrededor de un punto, y que no dice nada de tal comportamiento precisamente en dicho punto.

Supóngase f : (M, dM) -> (N, dN) es mapeado entre dos espacios métricos, p es un punto límite de M y LN. Decimos que "el límite de f en p es L" y escribimos

 lim_{x to p}f(x) = L

si y sólo si para todo ε > 0 existe un δ > 0 tal que para toda xM en 0 < dM(x, p) < δ, tenemos dN(f(x), L) < ε.

En términos de desigualdades, tenemos que el límite de la función f ( x ) en x = a es L si se cumple lo siguiente: para toda ε > 0 existe un δ (ε) > 0 tal que, para toda x:

si 0 < left| x - a right| < delta , entonces left| fleft(xright) - L right| < epsilon

Observemos que la solución de la desigualdad 0 < | x - a | < δ es la siguiente:

x pertenece a la vecindad ( a - δ , a ) U ( a, a + δ ): x no toca el valor de a, pues

0 < | x - a | implica x distinto de a,

mientras que la solución de | f (x) - L | < ε es la siguiente:

y pertenece al intervalo ( L - ε , L + ε ).

Esto proporciona la clave de la comprensión del concepto de límite, pues mientras que el valor de la x está en la vecindad horizontal alrededor del punto "a" y agujereada en "a" con radio delta y centro "a", aun cuando en ese punto "a" no esté definida, el valor de y está en el intervalo vertical con centro en f(a) y radio épsilon.

Notación de límite [editar]

Límite de una función en un punto [editar]

Sea f una función real, entonces

 lim_{x to p}f(x) = L (x,Lin{mathbb{R}})

si y sólo si

para todo  varepsilon>0 existe un δ > 0 tal que para todo número real x en el dominio de la función

0 < |x-p| < delta Rightarrow |f(x)-L| < varepsilon

Notación formal: forall varepsilon >0,  exists {delta >0} / forall_{xinmathbb{D}} 0< |x-p|<delta Rightarrow |f(x)-L|< varepsilon

Indeterminaciones [editar]

Hay varios tipos de indeterminaciones, entre ellos:

    begin{array}{ll}       infty - infty                                cfrac{infty}{infty} & cfrac{0}{0}          infty cdot 0         & 1^infty              infty ^0              & 0^0     end{array}

* Nota: infty ,! se refiere al límite que tiende infinito y 0 ,! al límite cuando tiende 0 (no al número 0).

Ejemplo: 0/0 es una indeterminación pues límites de cocientes donde los límites de dividendo y divisor separadamente son cero, pueden terminar dando cualquier cosa, como los siguientes:

lim_{trightarrow 0}frac{t}{t^2}=inftylim_{trightarrow 0}frac{t}{t}=1lim_{trightarrow 0}frac{t^2}{t}=0

Propiedades de los límites [editar]

Si k es un escalar:

  1.  lim_{x to p} k =, k,
  2.  lim_{x to p} x = , p ,
  3.  lim_{x to p} kf(x) =, klim_{x to p} f(x),
  4.  lim_{x to p} (f(x) + g(x)) =, lim_{x to p} f(x) + lim_{x to p} g(x),
  5.  lim_{x to p} (f(x) - g(x)) =, lim_{x to p} f(x) - lim_{x to p} g(x),
  6.  lim_{x to p} (f(x) g(x)) =, lim_{x to p} f(x) cdot lim_{x to p} g(x),
  7.  lim_{x to p} {{f(x)}over {g(x)}} =, {{lim_{x to p} {f(x)}} over {lim_{x to p} {g(x)}}}, si g(x) ne 0  y lim_{x to p} g(x) ne 0,
  8.  {lim_{x to 0} left(1+xright)^{1 over x}} =, e
  9.  {lim_{x to infty} left(1+{1 over x}right)^x } =, e
  10.  {lim_{x to infty} x ; sin left (frac {2pi}{x} right ) cos left (frac {2pi}{x} right )} =,2pi
  11.  {lim_{x to 0} {{operatorname{sen}x} over x}} =, 1 , = {lim_{x to 0} {{x over operatorname{sen}x}}}
  12.  {lim_{x to 0} {tan x over x}} =, 1 , = {lim_{x to 0} {x over tan x}}
  13.  {lim_{x to 0} {operatorname{sen}x over tan x}} =, 1 , = {lim_{x to 0} {tan x over operatorname{sen} x}}
  14.  {lim_{x to p} left(f(x) cdot g(x)right)} =, 0 Leftrightarrow f(x) acotada y g(x) infinitésimo
  15.  {lim_{x to 0} frac {1-cos x}{x} } =, 0 ,

Véase también [editar]

Referencias [editar]

04/05/2010 11:17 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: LÍMITES MATEMÁTICOS. LOS LÍMITES MATEMÁTICOS EXPLICAN CÓMO VARÍA UNAS SECUENCIA DE PUNTOS AL VARÍAR UNO DE ELLOS. TIENE MUCHAS APLICACIONES EN FÍSICA, ASTRONOMÍA Y ASTROLOGÍA Y EN CIENCIAS COMO LA GEOMETRÍA Y EL ANÁLISIS DIFERENCIAL O DE DIFERENCIAS. En matemática, el límite es un concepto que describe la tendencia de una sucesión o una función, a medida que los parámetros de esa sucesión o función se acercan a determinado valor. En cálculo (especialmente en análisis real y matemático) este concepto se utiliza para definir los conceptos fundamentales de convergencia, continuidad, derivación, integración, entre otros.

Límite matemático

De Wikipedia, la enciclopedia libre

En matemática, el límite es un concepto que describe la tendencia de una sucesión o una función, a medida que los parámetros de esa sucesión o función se acercan a determinado valor. En cálculo (especialmente en análisis real y matemático) este concepto se utiliza para definir los conceptos fundamentales de convergencia, continuidad, derivación, integración, entre otros.

Contenido

[ocultar]

Límite de una función [editar]

Visualización de los parámetros utilizados en la definición de límite.
Artículo principal: Límite de una función

Definición rigurosa [editar]

Informalmente, se dice que el límite de la función f(x) es L cuando x tiende a c, y se escribe:

 lim_{xto c} , , f(x) = L

si se puede encontrar para cada ocasión un x suficientemente cerca de c tal que el valor de f(x) sea tan próximo a L como se desee. Formalmente, utilizando términos lógico-matemáticos:

    begin{array}{l}       underset {xto c}{lim} , , f(x) = L iff  forall varepsilon > 0   exists  delta > 0 :            forall x(0<|x-c|<delta longrightarrow |f(x)-L|<epsilon)    end{array}

Esta definición se denomina frecuentemente definición épsilon-delta de límite, y se lee como:

"para cada número real ε mayor que cero existe un número real δ mayor que cero tal que, para todo x, si la distancia entre x y c (x no es igual a c) es menor que δ, entonces la distancia entre la imagen de x y L es menor que ε unidades".

Límites notables [editar]

Como ejemplo de límites notables tenemos los siguientes límites de funciones, que proveen resultados muy interesantes.

Demostración [editar]

Para demostrar, por ejemplo, el segundo de estos límites, se utilizará la inecuación sen(x) < x < tan(x) en el intervalo (0,π/2), que relaciona x con las funciones seno y tangente. Luego dividimos por sen(x), obteniendo:

1 < frac{x}{operatorname{sen,}x} < frac{1}{cos x}

Invirtiendo los términos de la inecuación y cambiando los signos de desigualdad:

cos x < frac{operatorname{sen,} x}{x} < 1

Calculando el límite cuando x tiende a 0:

lim_{xto 0} cos x < lim_{xto 0} frac{operatorname{sen,} x}{x} < lim_{xto 0} 1

Lo que es igual a:

1 < lim_{xto 0} frac{operatorname{sen,} x}{x} < 1

Aplicando el teorema del sándwich o teorema de estricción, el límite necesariamente vale 1:

lim_{xto 0}frac{operatorname{sen,}(x)}{x}=1

El tercero de los límites se demuestra utilizando las propiedades de los límites y el valor obtenido en el límite anterior. Es decir:

  {lim_{x to 0} left (frac {tan x}{x} right )} =   {lim_{x to 0} left (frac {operatorname{sen,} x}{x} right )} cdot lim_{x to 0} frac{1}{cos x}= 1 cdot 1 = 1

El límite que obtiene el número e se demuestra de manera análoga, desarrollando el binomio de Newton y aplicando el límite cuando x tiende a infinito.

Límite de una sucesión [editar]

 a_{n} = begin{cases} 16 & mbox{si } n = 0  cfrac{a_{n-1}}{2} & mbox{si } n > 0 end{cases}
Artículo principal: Límite de una sucesión

La definición del límite matemático en el caso de una sucesión es muy parecida a la definición del límite de una función cuando x tiende a infty. Decimos que la sucesión an tiende hasta su límite a, o que converge o es convergente (a a), lo que denotamos como:

lim_{ntoinfty}a_n = a

si podemos encontrar un número N tal que todos los términos de la sucesión a a cuando n crece sin cota. Formalmente:

a_n to a Leftrightarrow forallepsilon>0, exists N>0 : forall nge N, |a_n - a|<epsilon

Propiedades de los límites [editar]

Generales [editar]

Los límites, como otros entes matemáticos, cumplen las siguientes propiedades generales, que son usadas muchas veces para simplificar el cálculo de los mismos.

  •  lim_{x to a} x = , a ,
  • Límite por un escalar.
 lim_{x to a} kf(x) =, klim_{x to a} f(x), donde k es un multiplicador escalar.
  • Límite de una suma.
 lim_{x to a} (f(x) + g(x)) =, lim_{x to a} f(x) + lim_{x to a} g(x),
  • Límite de una resta.
 lim_{x to a} (f(x) - g(x)) =, lim_{x to a} f(x) - lim_{x to a} g(x),
  • Límite de una multiplicación.
 lim_{x to a} (f(x) cdot g(x)) =, lim_{x to a} f(x) cdot lim_{x to a} g(x),
  • Límite de una división.
    underset {x to a} {lim} ; frac {f(x)}{g(x)} =    frac        {underset {x to a} {lim} ; f(x)}       {underset {x to a} {lim} ; g(x)}    quad    mathrm{si} lim_{x to a} g(x) ne 0

Indeterminaciones [editar]

Hay límites que evaluándolos directamente, se obtiene alguna de las siguientes expresiones:

infty - infty, ; frac{infty}{infty}, ; infty cdot 0 , ; frac{0}{0}, ; infty ^0, ; 1^infty,0^0 ,

A estas expresiones se les denomina indeterminaciones, ya que, a simple vista, no está claro cual puede ser el límite (si es que existe). Por ejemplo, en la segunda de estas ecuaciones, el límite pudiese valer 0, 1 o infinito. En algunos casos, simplificando las expresiones u obteniendo expresiones equivalentes a las iniciales, mediante racionalización o factorización se puede resolver la indeterminación y calcular el límite. En otros casos, se requerirá el uso de otras herramientas más potentes como pueden ser las desigualdades o la regla de L'Hopital.

Un ejemplo de indeterminación del tipo textstyle frac{0}{0} es la que se da en estos tres casos, y en cada caso (tras simplificar), se obtiene un límite distinto :

lim_{trightarrow 0}frac{t}{t^2}=frac{0}{0} quad xrightarrow[mathrm{simplificando}]{}  quad  lim_{trightarrow 0}frac{1}{t} = infty

lim_{trightarrow 0}frac{t}{t}=frac{0}{0} quad xrightarrow[mathrm{simplificando}]{}  quad  lim_{trightarrow 0} 1 =1

lim_{trightarrow 0}frac{t^2}{t}=frac{0}{0} quad xrightarrow[mathrm{simplificando}]{}  quad  lim_{trightarrow 0} {t} = 0

Enlaces externos [editar]

04/05/2010 11:07 petalofucsia #. Matemáticas Hay 2 comentarios.

MATEMÁTICAS: VARIABLE ESTADÍSTICA. Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Variable estadística

De Wikipedia, la enciclopedia libre

 

Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Clasificación de las variables [editar]

En un estudio científico, podemos clasificar las variables según la escala de medición o la influencia que asignemos a unas variables sobre otras y por esta razón, se pueden clasificar como sigue:

  • Según la medición:
    • Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
      1. Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave.
      2. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.
    • Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:
      1. Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
      2. Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.
  • Según la influencia que asignemos a unas variables sobre otras, podrán ser:
    • Variables independientes: Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.
    • Variables dependientes: Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.

Variable Independiente:

es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así, a la variable que el investigador manipula.

Variable Dependiente:

Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.

La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Variable Interviniente:

Son aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

Variable Moderadora:

Según Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.


22/04/2010 13:28 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS: GENIALIDAD. VARIABLES. Una variable es un símbolo que representa un elemento no especificado de un conjunto dado. Dicho conjunto es llamado conjunto universal de la variable, universo o dominio de la variable, y cada elemento del conjunto es un valor de la variable. Sea x una variable cuyo universo es el conjunto {1,3,5,7,9,11,13}; entonces x puede tener cualquiera de esos valores: 1,3,5,7,9,11,13. En otras palabras x puede reemplazarse por cualquier entero positivo impar menor que 14. Por esta razón, a menudo se dice que una variable es un reemplazo de cualquier elemento de su universo.

Variable

De Wikipedia, la enciclopedia libre

 

Una variable es un elemento de una fórmula, proposición o algoritmo que puede adquirir o ser sustituido por un valor cualquiera (siempre dentro de su universo). Los valores que una variable es capaz de recibir, pueden estar definidos dentro de un rango, y/o estar limitados por criterios o condiciones de pertenencia, al universo que les corresponde (en estos casos, el universo de la variable pasa a ser un subconjunto de un universo mayor, el que tendría sin las restricciones).

Hay diversos tipos de variables:

En muchos usos, lo contrario de una variable es una constante. También puede considerarse a las constantes como caso particular de variables, con un universo unitario (con un solo elemento), ya que sólo pueden tener un valor, y no pueden modificarlo.

Véase también [editar]

22/04/2010 13:22 petalofucsia #. Matemáticas No hay comentarios. Comentar.

MATEMÁTICAS. Las matemáticas o la matemática (del lat. mathematĭca, y éste del gr. μαθηματικά, derivado de μάθημα, conocimiento) es una ciencia que, a partir de notaciones básicas exactas y a través del razonamiento lógico, estudia las propiedades y relaciones cuantitativas entre los entes abstractos (números, figuras geométricas, símbolos).[2] Mediante las matemáticas conocemos las cantidades, las estructuras, el espacio y los cambios. Los matemáticos buscan patrones,[3] [4] formulan nuevas conjeturas e intentan alcanzar la verdad matemática mediante rigurosas deducciones. Éstas les permiten establecer los axiomas y las definiciones apropiados para dicho fin.[5

Matemáticas

De Wikipedia, la enciclopedia libre

Euclides, matemático griego, del siglo III a. C., tal como fue imaginado por Rafael. Detalle de La Escuela de Atenas.[1]

Las matemáticas o la matemática (del lat. mathematĭca, y éste del gr. μαθηματικά, derivado de μάθημα, conocimiento) es una ciencia que, a partir de notaciones básicas exactas y a través del razonamiento lógico, estudia las propiedades y relaciones cuantitativas entre los entes abstractos (números, figuras geométricas, símbolos).[2] Mediante las matemáticas conocemos las cantidades, las estructuras, el espacio y los cambios. Los matemáticos buscan patrones,[3] [4] formulan nuevas conjeturas e intentan alcanzar la verdad matemática mediante rigurosas deducciones. Éstas les permiten establecer los axiomas y las definiciones apropiados para dicho fin.[5]

Existe cierto debate acerca de si los objetos matemáticos, como los números y puntos, realmente existen o si provienen de la imaginación humana. El matemático Benjamin Peirce definió las matemáticas como "la ciencia que señala las conclusiones necesarias".[6] Por otro lado, Albert Einstein declaró que "cuando las leyes de la matemática se refieren a la realidad, no son ciertas; cuando son ciertas, no se refieren a la realidad".[7]

Mediante la abstracción y el uso de la lógica en el razonamiento, las matemáticas han evolucionado basándose en las cuentas, el cálculo y las mediciones, junto con el estudio sistemático de la forma y el movimiento de los objetos físicos. Las matemáticas, desde sus comienzos, han tenido un fin práctico (véase: Historia de la matemática). Las explicaciones que se apoyaban en la lógica aparecieron por primera vez con la matemática helénica, especialmente con los Elementos de Euclides. Las matemáticas siguieron desarrollándose, con continuas interrupciones, hasta que en el Renacimiento las innovaciones matemáticas interactuaron con los nuevos descubrimientos científicos. Como consecuencia, hubo una aceleración en la investigación que continúa hasta la actualidad.

Hoy en día, las Matemáticas se usan en todo el mundo como una herramienta esencial en muchos campos, entre los que se encuentran las ciencias naturales, la ingeniería, la medicina y las ciencias sociales, e incluso disciplinas que, aparentemente, no están vinculadas con ella, como la música (por ejemplo, en cuestiones de resonancia armónica). Las matemáticas aplicadas, rama de las matemáticas destinada a la aplicación de los conocimientos matemáticos a otros ámbitos, inspiran y hacen uso de los nuevos descubrimientos matemáticos y, en ocasiones, conducen al desarrollo de nuevas disciplinas. Los matemáticos también participan en las matemáticas puras, sin tener en cuenta la aplicación de esta ciencia, aunque las aplicaciones prácticas de las matemáticas puras suelen ser descubiertas con el paso del tiempo.[8]

Contenido

[ocultar]

Etimología

La palabra "matemática" (del griego μαθηματικά, «lo que se aprende») viene del griego antiguo μάθημα (máthēma), que quiere decir «campo de estudio o instrucción». El significado se contrapone a μουσική (musiké) «lo que se puede entender sin haber sido instruido», que refiere a poesía, retórica y campos similares, mientras que μαθηματική se refiere a las áreas del conocimiento que sólo pueden entenderse tras haber sido instruido en las mismas (astronomía, aritmética).[9] Aunque el término ya era usado por los pitagóricos en el siglo VI a. C., alcanzó su significado más técnico y reducido de "estudio matemático" en los tiempos de Aristóteles (siglo IV a. C.). Su adjetivo es μαθηματικός (mathēmatikós), "relacionado con el aprendizaje", lo cual, de manera similar, vino a significar "matemático". En particular, μαθηματική τέχνη (mathēmatikḗ tékhnē; en latín ars mathematica), significa "el arte matemática".

La forma plural matemáticas viene de la forma latina mathematica (Cicerón), basada en el plural en griego τα μαθηματικά (ta mathēmatiká), usada por Aristóteles y que significa, a grandes rasgos, "todas las cosas matemáticas".

Historia

Artículo principal: Historia de la matemática

La evolución de la matemática puede ser considerada como el resultado de un incremento de la capacidad de abstracción del hombre o como una expansión de la materia estudiada. Los primeros conceptos abstractos utilizados por el hombre, aunque también por muchos animales,[10] fueron probablemente los números. Esta noción nació de la necesidad de contar los objetos que nos rodeaban.

Desde el comienzo de la historia, las principales disciplinas matemáticas surgieron de la necesidad del hombre de hacer cálculos con el fin de controlar los impuestos y el comercio, comprender las relaciones entre los números, la medición de terrenos y la predicción de los eventos astronómicos. Estas necesidades están estrechamente relacionadas con las principales propiedades que estudian las matemáticas — la cantidad, la estructura, el espacio y el cambio. Desde entonces, las matemáticas han tenido un profuso desarrollo y se ha producido una fructífera interacción entre las matemáticas y la ciencia, en beneficio de ambas. Diversos descubrimientos matemáticos se han sucedido a lo largo de la historia y se continúan produciendo en la actualidad.

Además de saber contar los objetos físicos, los hombres prehistóricos también sabían cómo contar cantidades abstractas como el tiempo (días, estaciones, años, etc.) Asimismo empezaron a dominar la aritmética elemental (suma, resta, multiplicación y división).

Un quipu, utilizado por los Incas para registrar los números.

Los siguientes avances requirieron la escritura o algún otro sistema para registrar los números, tales como los tallies o las cuerdas anudadas —denominadas quipu —, que eran utilizadas por los Incas para almacenar datos numéricos. Los sistemas de numeración han sido muchos y diversos. Los primeros escritos conocidos que contienen números fueron creados por los egipcios en el Imperio Medio, entre ellos se encuentra el Papiro de Ahmes. La Cultura del valle del Indo desarrolló el moderno sistema decimal, junto con el concepto de cero.

Los antiguos babilonios utilizaban el sistema sexagesimal, escala matemática que tiene por base el número sesenta. De este sistema la humanidad heredó la división actual del tiempo: el día en veinticuatro horas - o en dos períodos de doce horas cada uno -, la hora en sesenta minutos y el minuto en sesenta segundos. Los árabes proporcionaron a la cultura europea su sistema de numeración, que reemplazó a la numeración romana. Este sistema prácticamente no se conocía en Europa antes de que el matemático Leonardo Fibonacci lo introdujera en 1202 en su obra Liber abbaci (Libro del ábaco). En un principio los europeos tardaron en reaccionar, pero hacia finales de la Edad Media habían aceptado el nuevo sistema numérico, cuya sencillez estimuló y alentó el progreso de la ciencia.

Los números mayas del 0 al 19.

Los mayas desarrollaron una avanzada civilización precolombina, con avances notables en la matemática, empleando el concepto del cero, y en la astronomía, calculando con bastante precisión los ciclos celestes.

Grandes matemáticos de la historia

Algunos de los matemáticos más emblemáticos han sido:

Inventor del Teorema de Tales, que establece que, si a un triángulo cualquiera le trazamos una paralela a cualquiera de sus lados, obtenemos dos triángulos semejantes. Dos triángulos son semejantes si tienen los ángulos iguales y sus lados son proporcionales, es decir, que la igualdad de los cocientes equivale al paralelismo. Este teorema establece así una relación entre el álgebra y la geometría.
  • Pitágoras: (582-500 a. C.). Fundador de la escuela pitagórica, cuyos principios se regían por el amor a la sabiduría, a las matemáticas y música.
Inventor del Teorema de Pitágoras, que establece que, en un triángulo rectángulo, el cuadrado de la hipotenusa (el lado opuesto al ángulo recto) es igual a la suma de los cuadrados de los dos catetos (los dos lados del triángulo menores que la hipotenusa y que conforman el ángulo recto). Además del teorema anteriormente mencionado, también invento una tabla de multiplicar.
  • Euclides: (aproximadamente 365-300 a. C.). Sabio griego, cuya obra "Elementos de Geometría" está considerada como el texto matemático más importante de la historia.
Los teoremas de Euclides son los que generalmente se aprenden en la escuela moderna. Por citar algunos de los más conocidos: - La suma de los ángulos interiores de cualquier triángulo es 180°. - En un triángulo rectángulo el cuadrado de la hipotenusa es igual a la suma de los cuadrados de los catetos, que es el famoso teorema de Pitágoras.
  • Arquímedes: (287-212 a. C.). Fue el matemático más importante de la Edad Antigua. También conocido por una de sus frases: "Eureka, eureka, lo encontré". Su mayor logro fue el descubrimiento de la relación entre la superficie y el volumen de una esfera y el cilindro que la circunscribe. Su principio más conocido fue el Principio de Arquímedes, que consiste en que todo cuerpo sumergido en un fluido experimenta un empuje vertical y hacia arriba igual al peso de fluido que desaloja.
  • Fibonacci: (1170-1240). Matemático italiano que realizó importantísimas aportaciones en los campos matemáticos del álgebra y la teoría de números. Descubridor de la Sucesión de Fibonacci, que consiste es una sucesión infinita de números naturales.
  • René Descartes: (1596-1650). Matemático francés, que escribió una obra sobre la teoría de las ecuaciones, en la cual se incluía la regla de los signos, para saber el número de raíces positivas y negativas de una ecuación. Inventó una de las ramas de las matemáticas, la geometría analítica.
  • Isaac Newton: (1643-1727). Matemático inglés, autor de los Philosophiae naturalis principia mathematica. Abordó el teorema del binomio, a partir de los trabajos de John Wallis, y desarrolló un método propio denominado cálculo de fluxiones. Abordó el desarrollo del cálculo a partir de la geometría analítica desarrollando un enfoque geométrico y analítico de las derivadas matemáticas aplicadas sobre curvas definidas a través de ecuaciones.
  • Gottfried Leibniz: (1646-1716). Matemático alemán, desarrolló, con independencia de Newton, el cálculo infinitesimal. Creó la notación y el corpus conceptual del cálculo que se usa en la actualidad. Realizó importantes aportaciones en el campo de la teoría de los números y la geometría analítica.
  • Galileo Galilei: (1564-1642). Matemático italiano, cuyo principal logro fue el crear un nexo de unión entre las matemáticas y la mecánica. Fue el descubridor de la ley de la isocronía de los péndulos. Se inspira en Pitágoras, Platón y Arquímedes y fue contrario a Aristóteles.
  • Blaise Pascal: (1623-1662). Matemático francés que formuló uno de los teoremas básicos de la geometría proyectiva, que se denominó como Teorema de Pascal y que él mismo llamo Teoría matemática de la probabilidad.
  • Leonhard Euler: (1707-1783). Matemático suizo que realizó importantes descubrimientos en el campo del cálculo y la teoría de grafos. También introdujo gran parte de la moderna terminología y notación matemática, particularmente para el área del análisis matemático, como por ejemplo la noción de función matemática.
  • Paolo Ruffini: (1765-1822). Matemático italiano que estableció las bases de la teoría de las transformaciones de ecuaciones, descubrió y formuló la regla del cálculo aproximado de las raíces de las ecuaciones, y su más importante logro, inventó lo que se conoce como Regla de Ruffini, que permite hallar los coeficientes del resultado de la división de un polinomio por el binomio (x - r).
  • Joseph-Louis de Lagrange: (1736-1813). Matemático franco-italiano, considerado como uno de los más importantes de la historia, realizó importantes contribuciones en el campo del cálculo y de la teoría de los números. Fue el padre de la mecánica analítica, a la que dio forma diferencial, creó la disciplina del análisis matemático, abrió nuevos campos de estudio en la teoría de las ecuaciones diferenciales y contribuyó al establecimiento formal del análisis numérico como disciplina.
  • Carl Friedrich Gauss: (1777-1855). Matemático alemán al que se le conoce como "el príncipe de las matemáticas". Ha contribuido notablemente en varias áreas de las matemáticas, en las que destacan la teoría de números, el análisis matemático, la geometría diferencial. Fue el primero en probar rigurosamente el Teorema Fundamental del Álgebra. Inventó lo que se conoce como Método de Gauss, que lo utilizó para resolver sistemas de tres ecuaciones lineales con tres incógnitas.
  • Augustin Louis Cauchy: (1789-1857). Matemático francés, pionero en el análisis matemático y la teoría de grupos. Ofreció la primera definición formal de función, límite y continuidad. También trabajó la teoría de los determinantes, probabilidad, el cálculo complejo, y las series.
  • Jean-Baptiste Joseph Fourier: (1768-1830). Matemático francés. Estudió la transmisión de calor, desarrollando para ello la Transformada de Fourier; de esta manera, extendió el concepto de función e introdujo una nueva rama dentro de la teoría de las ecuaciones diferenciales.

Influencia en la astronomía moderna

El astrónomo Tycho Brahe anotó minuciosamente durante largo tiempo observaciones planetarias. Cuando leyó El misterio cosmográfico, quedó impresionado con la percepción matemática y astronómica de Kepler y le invitó a trabajar con él en Benatky, localidad cercana a Praga. Al verse obligado a tener que abandonar Graz debido a la intolerancia religiosa, Kepler aceptó la invitación. Al fallecer Brahe, Kepler le sucedió como matemático imperial de Rodolfo II y analizó las medidas sobre la posición de los planetas. Las medidas del movimiento de Marte, en particular de su movimiento retrógrado, fueron esenciales para que pudiera formular las tres leyes de Kepler sobre el movimiento de los planetas. Posteriormente, estas leyes sirvieron de base a la ley de gravitación universal de Newton.

Crisis históricas

La matemática ha pasado por tres crisis históricas importantes:[11]

  1. El descubrimiento de la inconmensurabilidad por los griegos, la existencia de los números irracionales que de alguna forma debilitó la filosofía de los pitagóricos.
  2. La aparición del cálculo en el siglo XVII, con el temor de que fuera ilegítimo manejar infinitesimales.
  3. El hallazgo de las antinomias, como la de Russell o la paradoja de Berry a comienzos del siglo XX, que atacaban los mismos cimientos de la materia.

La inspiración, las matemáticas puras y aplicadas y la estética

Artículo principal: Belleza matemática
Sir Isaac Newton (1643-1727), comparte con Leibniz la autoría del desarrollo del cálculo integral y diferencial.

Las matemáticas surgen cuando hay problemas difíciles en los que intervienen la cantidad, la estructura, el espacio y el cambio de los objetos. Al principio, las matemáticas se encontraban en el comercio, en la medición de los terrenos y, posteriormente, en la astronomía. Actualmente, todas las ciencias aportan problemas que son estudiados por matemáticos, al mismo tiempo que aparecen nuevos problemas dentro de las propias matemáticas. Por ejemplo, el físico Richard Feynman inventó la integral de caminos de la mecánica cuántica, combinando el razonamiento matemático y el enfoque de la física. Hoy la teoría de las cuerdas, una teoría científica en desarrollo que trata de unificar las cuatro fuerzas fundamentales de la física, sigue inspirando a las más modernas matemáticas.[12] Algunas matemáticas solo son relevantes en el área en la que estaban inspiradas y son aplicadas para otros problemas en ese campo. Sin embargo, a menudo las matemáticas inspiradas en un área concreta resultan útiles en muchos ámbitos, y se incluyen dentro de los conceptos matemáticos generales aceptados. El notable hecho de que incluso la matemática más pura habitualmente tiene aplicaciones prácticas es lo que Eugene Wigner ha definido como la irrazonable eficacia de las matemáticas en las Ciencias Naturales.[13]

Como en la mayoría de las áreas de estudio, la explosión de los conocimientos en la era científica ha llevado a la especialización de las matemáticas. Hay una importante distinción entre las matemáticas puras y las matemáticas aplicadas. La mayoría de los matemáticos que se dedican a la investigación se centran únicamente en una de estas áreas y, a veces, la elección se realiza cuando comienzan su licenciatura. Varias áreas de las matemáticas aplicadas se han fusionado con otras areas tradicionalmente fuera de las matemáticas y se han convertido en disciplinas independientes, como pueden ser la estadística, la investigación de operaciones o la informática.

Aquellos que sienten predilección por las matemáticas, consideran que prevalece un aspecto estético que define a la mayoría de las matemáticas. Muchos matemáticos hablan de la elegancia de la matemática, su intrínseca estética y su belleza interna. En general, uno de sus aspectos más valorados es la simplicidad. Hay belleza en una simple y contundente demostración, como la demostración de Euclides de la existencia de infinitos números primos, y en un elegante análisis numérico que acelera el cálculo, así como en la transformada rápida de Fourier. G. H. Hardy en A Mathematician's Apology (Apología de un matemático) expresó la convicción de que estas consideraciones estéticas son, en sí mismas, suficientes para justificar el estudio de las matemáticas puras.[14] Los matemáticos con frecuencia se esfuerzan por encontrar demostraciones de los teoremas que son especialmente elegantes, el excéntrico matemático Paul Erdős se refiere a este hecho como la búsqueda de pruebas de "El Libro" en el que Dios ha escrito sus demostraciones favoritas.[15] [16] La popularidad de la matemática recreativa es otra señal que nos indica el placer que produce resolver las preguntas matemáticas.

Notación, lenguaje y rigor

Leonhard Euler. Probablemente el más prolífico matemático de todos los tiempos.
Artículo principal: Notación matemática

La mayor parte de la notación matemática que se utiliza hoy en día no se inventó hasta el siglo XVIII.[17] Antes de eso, las matemáticas eran escritas con palabras, un minucioso proceso que limita el avance matemático. En el siglo XVIII, Euler, fue responsable de muchas de las notaciones empleadas en la actualidad. La notación moderna hace que las matemáticas sean mucho más fácil para los profesionales, pero para los principiantes resulta complicada. La notación reduce las matemáticas al máximo, hace que algunos símbolos contengan una gran cantidad de información. Al igual que la notación musical, la notación matemática moderna tiene una sintaxis estricta y codifica la información que sería difícil de escribir de otra manera.

El símbolo de infinito en diferentes tipografías.

El lenguaje matemático también puede ser difícil para los principiantes. Palabras tales como o y sólo tiene significados más precisos que en lenguaje cotidiano. Además, palabras como abierto y cuerpo tienen significados matemáticos muy concretos. La jerga matemática, o lenguaje matematico, incluye términos técnicos como homeomorfismo o integrabilidad. La razón que explica la necesidad de utilizar la notación y la jerga es que el lenguaje matemático requiere más precisión que el lenguaje cotidiano. Los matemáticos se refieren a esta precisión en el lenguaje y en la lógica como el "rigor".

El rigor es una condición indispensable que debe tener una demostración matemática. Los matemáticos quieren que sus teoremas a partir de los axiomas sigan un razonamiento sistemático. Esto sirve para evitar teoremas erróneos, basados en intuiciones falibles, que se han dado varias veces en la historia de esta ciencia.[18] El nivel de rigor previsto en las matemáticas ha variado con el tiempo: los griegos buscaban argumentos detallados, pero en tiempos de Isaac Newton los métodos empleados eran menos rigurosos. Los problemas inherentes de las definiciones que Newton utilizaba dieron lugar a un resurgimiento de un análisis cuidadoso y a las demostraciones oficiales del siglo XIX. Ahora, los matemáticos continúan apoyándose entre ellos mediante demostraciones asistidas por ordenador.[19]

Un axioma se interpreta tradicionalmente como una "verdad evidente", pero esta concepción es problemática. En el ámbito formal, un axioma no es más que una cadena de símbolos, que tiene un significado intrínseco sólo en el contexto de todas las fórmulas derivadas de un sistema axiomático.

La matemática como ciencia

Carl Friedrich Gauss, apodado el "príncipe de los matemáticos", se refería a la matemática como "la reina de las ciencias".

Carl Friedrich Gauss se refería a la matemática como "la reina de las ciencias".[20] Tanto en el latín original Scientiarum Regina, así como en alemán Königin der Wissenschaften, la palabra ciencia debe ser interpretada como (campo de) conocimiento. Si se considera que la ciencia es el estudio del mundo físico, entonces las matemáticas, o por lo menos matemáticas puras, no son una ciencia.

Muchos filósofos creen que las matemáticas no son experimentalmente falseables, y, por tanto, no es una ciencia según la definición de Karl Popper.[21] No obstante, en la década de 1930 una importante labor en la lógica matemática demuestra que las matemáticas no puede reducirse a la lógica, y Karl Popper llegó a la conclusión de que "la mayoría de las teorías matemáticas son, como las de física y biología, hipotético-deductivas. Por lo tanto, las matemáticas puras se han vuelto más cercanas a las ciencias naturales cuyas hipótesis son conjeturas, así ha sido hasta ahora".[22] Otros pensadores, en particular Imre Lakatos, han solicitado una versión de Falsacionismo para las propias matemáticas.

Una visión alterantiva es que determinados campos científicos (como la física teórica) son matemáticas con axiomas que pretenden corresponder a la realidad. De hecho, el físico teórico, J. M. Ziman, propone que la ciencia es conocimiento público y, por tanto, incluye a las matemáticas.[23] En cualquier caso, las matemáticas tienen mucho en común con muchos campos de las ciencias físicas, especialmente la exploración de las consecuencias lógicas de las hipótesis. La intuición y la experimentación también desempeñan un papel importante en la formulación de conjeturas en las matemáticas y las otras ciencias. Las matemáticas experimentales siguen ganando representación dentro de las matemáticas. El cálculo y simulación están jugando un papel cada vez mayor tanto en las ciencias como en las matemáticas, atenuando la objeción de que las matemáticas se sirven del método científico. En 2002 Stephen Wolfram sostiene, en su libro Un nuevo tipo de ciencia, que la matemática computacional merece ser explorada empíricamente como un campo científico.

Las opiniones de los matemáticos sobre este asunto son muy variadas. Muchos matemáticos consideran que llamar a su campo ciencia es minimizar la importancia de su perfil estético, además supone negar su historia dentro de las siete artes liberales. Otros consideran que hacer caso omiso de su conexión con las ciencias supone ignorar la evidente conexión entre las matemáticas y sus aplicaciones en la ciencia y la ingeniería, que ha impulsado considerablemente el desarrollo de las matemáticas. Otro asunto de debate, que guarda cierta relación con el anterior, es si la matemática fue creada (como el arte) o descubierta (como la ciencia). Este es uno de los muchos temas de incumbencia de la filosofía de las matemáticas.

Los premios matemáticos se mantienen generalmente separados de sus equivalentes en la ciencia. El más prestigioso premio dentro de las matemáticas es la Medalla Fields,[24] [25] fue instaurado en 1936 y se concede cada 4 años. A menudo se le considera el equivalente del Premio Nobel para la ciencia. Otros premios son el Premio Wolf en matemática, creado en 1978, que reconoce el logro en vida de los matemáticos, y el Premio Abel, otro gran premio internacional, que se introdujo en 2003. Estos dos últimos se conceden por un excelente trabajo, que puede ser una investigación innovadora o la solución de un problema pendiente en un campo determinado. Una famosa lista de esos 23 problemas sin resolver, denominada los "Problemas de Hilbert", fue recopilada en 1900 por el matemático alemán David Hilbert. Esta lista ha alcanzado gran popularidad entre los matemáticos y, al menos, nueve de los problemas ya han sido resueltos. Una nueva lista de siete problemas fundamentales, titulada "Problemas del milenio", se publicó en 2000. La solución de cada uno de los problemas será recompensada con 1 millón de dólares. Curiosamente, tan solo uno (la Hipótesis de Riemann) aparece en ambas listas.

Ramas de estudio de las matemáticas

Las numerosas ramas de la matemática están muy interrelacionadas. En una subdivisión amplia de las matemáticas, se distinguen cuatro objetos de estudio básicos: la cantidad, la estructura, el espacio y el cambio.

  • Los diferentes tipos de cantidades (números) han jugado un papel obvio e importante en todos los aspectos cuantitativos y cualitativos del desarrollo de la cultura, la ciencia y la tecnología.
  • El estudio de la estructura comienza al considerar las diferentes propiedades de los números, inicialmente los números naturales y los números enteros. Las reglas que dirigen las operaciones aritméticas se estudian en el álgebra elemental, y las propiedades más profundas de los números enteros se estudian en la teoría de números. Después, la organización de conocimientos elementales produjo los sistemas axiomáticos (teorías), permitiendo el descubrimiento de conceptos estructurales que en la actualidad dominan esta ciencia (e.g. estructuras categóricas). La investigación de métodos para resolver ecuaciones lleva al campo del álgebra abstracta. El importante concepto de vector, generalizado a espacio vectorial, es estudiado en el álgebra lineal y pertenece a las dos ramas de la estructura y el espacio.
  • El estudio del espacio origina la geometría, primero la geometría euclídea y luego la trigonometría. En su faceta avanzada el surgimiento de la topología da la necesaria y correcta manera de pensar acerca de las nociones de cercanía y continuidad de nuestras concepciones espaciales.
Derivada.

La comprensión y descripción del cambio en variables mensurables es el tema central de las ciencias naturales y del cálculo. Para resolver problemas que se dirigen en forma natural a relaciones entre una cantidad y su tasa de cambio, se estudian las ecuaciones diferenciales y de sus soluciones. Los números usados para representar las cantidades continuas son los números reales. Para estudiar los procesos de cambio se utiliza el concepto de función matemática. Los conceptos de derivada e integral, introducidos por Newton y Leibniz, representan un papel clave en este estudio, que se denomina Análisis. Es conveniente para muchos fines introducir los números complejos, lo que da lugar al análisis complejo. El análisis funcional consiste en estudiar problemas cuya incógnita es una función, pensándola como un punto de un espacio funcional abstracto.

Un campo importante en matemática aplicada es el de la estadística, que permite la descripción, el análisis de probabilidad y la predicción de fenómenos que tienen variables aleatorias y que se usan en todas las ciencias.

El análisis numérico investiga los métodos para realizar los cálculos en computadoras.

A continuación se muestra una lista de las ramas interrelacionadas de las matemáticas:

Fundamentos y métodos Teoría de conjuntos, lógica matemática, teoría de categorías. Investigación operativa Teoría de grafos, teoría de juegos, programación entera, programación lineal, Simulación, optimización, método simplex, programación dinámica. Números Números naturales, números enteros, números racionales, números irracionales, número reales, números complejos, cuaterniones, octoniones, sedeniones, números hiperreales, números infinitos, dígito, sistema de numeración, número p-ádico. Análisis, continuidad y cambio Cálculo, cálculo vectorial, análisis, ecuaciones diferenciales, sistemas dinámicos y teoría del caos, funciones, logaritmo, sucesiones, series, análisis real, Análisis complejo, análisis funcional, álgebra de operadores. Estructuras Algebra abstracta, teoría de números, álgebra conmutativa, geometría algebraica, teoría de grupos, monoides, análisis, topología, álgebra lineal, teoría de grafos, teoría de categorías. Espacios Topología, geometría, teoría de haces, geometría algebraica - Geometría diferencial - Topología diferencial - Topología algebraica - Álgebra lineal - Cuaterniones y rotación en el espacio Matemática discreta Combinatoria, Teoría de conjuntos numerables - Probabilidad discreta - Estadística - Teoría de la computación - Criptografía - Teoría de grafos - Teoría de juegos Matemática aplicada Estadística, física matemática, matemática financiera, teoría de juegos, optimización, análisis numérico, Lógica difusa.

Conceptos erróneos

Lo que cuenta como conocimiento en matemática no se determina mediante experimentación, sino mediante demostraciones. No es la matemática, por lo tanto, una rama de la física (la ciencia con la que históricamente se encuentra más emparentada), puesto que la física es una ciencia empírica. Por otro lado, la experimentación desempeña un papel importante en la formulación de conjeturas razonables, por lo que no se excluye a ésta de la investigación en matemáticas.

La matemática no es un sistema intelectualmente cerrado, donde todo ya esté hecho. Aún existen gran cantidad de problemas esperando solución, así como una infinidad esperando su formulación.

Matemática no significa contabilidad. Si bien los cálculos aritméticos son importantes para los contables, los avances en matemática abstracta difícilmente cambiarán su forma de llevar los libros.

Matemática no significa numerología. La numerología es una pseudociencia que utiliza la aritmética modular para pasar de nombres y fechas a números a los que se les atribuye emociones o significados esotéricos, basados en la intuición.

El lenguaje formal no es una simple extensión de los lenguajes naturales humanos que utiliza una gramática y un vocabulario definidos con extrema precisión, cuyo propósito es la descripción y exploración de relaciones conceptuales y físicas. Recientemente, los avances en el estudio del lenguaje humano apuntan en una dirección diferente: los lenguajes naturales (como el español o el francés, por ejemplo) y los lenguajes formales (como el matemático o los lenguajes de programación) son estructuras de naturaleza básicamente diferente.

Véase también

Referencias

  1. En la antigüedad nadie hizo un retrato o una descripción de la apariencia física de Euclides mientras estaba vivo. Por lo tanto, la representación de Euclides en las obras de arte varía en función de la imaginación de cada artista (véase Euclides).
  2. «matemática», Diccionario de la lengua española (vigésima segunda edición), Real Academia Española, 2001, http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=matem%C3%A1tica 
  3. Steen, LA (29 de abril de 1988). Mathematics:The Science of Patterns (Scientific American Library, 1994) Science, 240: 611-616.
  4. Keith Devlin (1996). Matemáticas: La ciencia de los patrones: La búsqueda de la Orden en la vida, la mente y el Universo. Scientific American. ISBN 9780716750475.
  5. Jourdain
  6. Peirce, p.97
  7. Einstein, p. 15. La cita es la respuesta de Einstein a la pregunta: "¿Cómo puede ser que las matemáticas, siendo después de todo un producto del pensamiento humano independiente de la experiencia, estén tan admirablemente adaptadas a los objetos de la realidad? [1]"
  8. Peterson
  9. Heath, Thomas (1921). A History of Greek Mathematics.. Oxford, Clarendon Press. OCLC 2014918.
  10. S. Dehaene, Dehaene-Lambertz G. y L. Cohen, Resumen de los números de las representaciones en el cerebro humano y animal,Tendencias en Neurociencias, vol. 21 (8), agosto de 1998, 355-361. http://dx.doi.org/10.1016/S0166-2236 (98) 01263-6.
  11. El dedo de Galileo. Peter Atkins. En Espasa Calpe-2003
  12. Johnson, Gerald W.; Lapidus, Michel L. (2002). Oxford University Press (ed.). The Feynman Integral and Feynman's Operational Calculus.
  13. Eugene Wigner, 1960, "La irracional eficacia de las matemáticas en la de Ciencias Exactas y Naturales" Communications on Pure and Applied Mathematics13 '(1): 1-14.
  14. Hardy, GH (1940). A Mathematician's Apology.
  15. Oro, Bonnie; Simons, A. Rogers (2008). MAA (ed.). Proof and Other Dilemmas: Mathematics and Philosophy.
  16. Aigner, Martin; Ziegler, M. Gunter (2001). Proofs from the Book.
  17. Utilización de diversos símbolos matemáticos (Véase Anexo:Símbolos matemáticos)
  18. Véase falsa demostración para comprobar mediante ejemplos sencillos los errores que se pueden cometer en una demostración oficial. El teorema de los cuatro colores contiene ejemplos de demostraciones falsas aceptadas accidentalmente por otros matemáticos del momento.
  19. Ivars Peterson,La matemática turística, Freeman, 1988, ISBN 0-7167-1953-3. p. 4 "Algunos se quejan de que el programa de ordenador no puede ser verificado correctamente," (en referencia a la Haken de Apple la prueba de color Teorema de los Cuatro).
  20. Waltershausen
  21. Shasha, Dennis Elliot; Lazere, Cathy A. (1998). Fuera de su mente: La vida y de 15 de los Grandes Descubrimientos científicos, p. 228.
  22. Popper 1995, p. 56
  23. Ziman
  24. «Actualmente la Medalla Fields es sin duda el mejor y el más influyente premio en las matemáticas». Monastyrsky
  25. Riehm

Bibliografía

Enlaces externos

Wikilibros

Wikcionario

22/04/2010 13:12 petalofucsia #. Matemáticas No hay comentarios. Comentar.


Blog creado con Blogia.
Blogia apoya: Fundación Josep Carreras

Contrato Coloriuris