Ayuda, no entiendo las diferencias de espectro mp3,wav y ogg

  • 1
BrunoFM
#1 por BrunoFM el 30/12/2009
Hola amigos.
¿que tal?
Estoy realizando un trabajo de investigación sobre audio y me he quedado encallado en un punto.
Mi objetivo es codificar con el mismo codigo una canción mp3, wav y si fuese posible ogg a partir de su espectro (frecuencia- intensidad), es decir un analisis de frecuencia.
Bien, analizo 10 segundos de 2 canciones diferentes en los 3 formatos y me salen cosas que no acabo de pillar.
(Utilizo audacity, 512 muestra, ventana hanning, frecuencia lineal)


LAS TABLAS DE RESULTADO LAS PONGO EN OTRO MENSAJE ABAJO )


Al observar estas tablas hay muchas cosas que no comprendo. En teoria el mp3 lo que hace es recortar los picos de las frecuencias y cuanto mas alta es la frecuencia mas corta ¿verdad? Entonces, en la 1 canción, hasta la frecuencia 16020,7 tanto los db del wav como mp3 son = pero a partir de aqui cambian.
El problema es que al observar otra canción cambia todo totalmente, ahora es a partir de la frecuencia 20585,74.
¿porque?

¿cual es la relación entre el rango dinamico de wav y mp3?
Hace poco estube leiendo en el foro un chabal que comprovo si existian diferencias estadisticas entre el rms de 1 canción en mp3 y wav y le salia que no.
Yo lo he hecho pero con mas de una canción y en algunas como la 1 que he puesto me sale que si, pero la 2 me sale que no (esto lo realizo calculando la t de student).
Entonces ¿que esta pasando? Nose como hacer un coigo para la misma canción cuando esta en 2 formatos diferentes porque por lo que veo no existe ninguna relación coherente.

Ya cuando miro el formato ogg me parto porque veo que la diferencia es mas grande que en el mp3.

Si alguien me puediese aportar sus conocimientos se lo agradeceria muchisimo porque he leido cosas sobre esto en la revista de la web y tal y no encuentro la respuesta.

Gracias amigos!!
Subir
BrunoFM
#2 por BrunoFM el 30/12/2009

canción 1 (mp3)
frecuencia (hz) volumen (db)
86,132813 2,764331
172,265625 0,399397
258,398438 -5,512768
344,531250 -10,075083
430,664063 -11,366339
516,796875 -11,544230
602,929688 -13,777155
689,062500 -13,648476
775,195313 -12,054072
861,328125 -11,800490
947,460938 -12,610356
1033,593750 -11,278361
1119,726563 -13,631572
1205,859375 -15,688966
1291,992188 -17,003580
1378,125000 -16,999840
1464,257813 -18,099047
1550,390625 -15,074353
1636,523438 -15,704661
1722,656250 -18,389830
1808,789063 -18,340672
1894,921875 -19,344467
1981,054688 -20,209436
2067,187500 -18,477789
2153,320313 -17,683397
2239,453125 -17,783272
2325,585938 -17,622141
2411,718750 -18,403133
2497,851563 -18,866066
2583,984375 -18,334986
2670,117188 -18,258148
2756,250000 -19,297382
2842,382813 -20,009325
2928,515625 -20,488815
3014,648438 -19,263699
3100,781250 -17,970451
3186,914063 -18,597832
3273,046875 -18,427265
3359,179688 -18,370117
3445,312500 -18,783081
3531,445313 -19,222891
3617,578125 -19,978287
3703,710938 -18,636709
3789,843750 -18,464472
3875,976563 -20,260715
3962,109375 -19,455738
4048,242188 -19,184092
4134,375000 -20,244682
4220,507813 -19,956524
4306,640625 -19,319143
4392,773438 -17,116730
4478,906250 -18,244261
4565,039063 -21,496555
4651,171875 -21,350698
4737,304688 -19,763147
4823,437500 -21,919767
4909,570313 -22,215105
4995,703125 -21,857338
5081,835938 -19,997583
5167,968750 -21,030085
5254,101563 -23,180550
5340,234375 -23,605837
5426,367188 -23,198648
5512,500000 -22,560770
5598,632813 -23,293865
5684,765625 -25,650747
5770,898438 -26,077089
5857,031250 -25,238741
5943,164063 -24,631092
6029,296875 -25,601307
6115,429688 -26,333965
6201,562500 -25,312136
6287,695313 -26,417686
6373,828125 -26,297176
6459,960938 -25,764103
6546,093750 -25,955299
6632,226563 -26,493732
6718,359375 -23,859316
6804,492188 -22,200428
6890,625000 -25,450880
6976,757813 -26,744827
7062,890625 -26,489258
7149,023438 -26,418428
7235,156250 -26,283701
7321,289063 -27,148945
7407,421875 -26,274887
7493,554688 -24,166218
7579,687500 -25,212996
7665,820313 -28,128454
7751,953125 -28,384701
7838,085938 -24,305756
7924,218750 -22,073021
8010,351563 -23,811790
8096,484375 -24,215460
8182,617188 -22,150141
8268,750000 -21,485205
8354,882813 -23,767830
8441,015625 -26,909969
8527,148438 -28,521450
8613,281250 -27,938829
8699,414063 -28,002792
8785,546875 -28,417707
8871,679688 -27,723680
8957,812500 -29,165712
9043,945313 -30,469639
9130,078125 -29,065689
9216,210938 -29,046431
9302,343750 -29,894215
9388,476563 -30,363239
9474,609375 -30,619761
9560,742188 -30,046808
9646,875000 -29,899975
9733,007813 -31,955791
9819,140625 -32,441284
9905,273438 -32,087749
9991,406250 -32,291218
10077,539063 -32,490387
10163,671875 -32,484589
10249,804688 -31,812786
10335,937500 -32,661915
10422,070313 -32,795910
10508,203125 -32,122459
10594,335938 -32,540432
10680,468750 -31,947430
10766,601563 -30,423546
10852,734375 -33,221325
10938,867188 -34,078365
11025,000000 -32,761013
11111,132813 -34,518627
11197,265625 -35,511265
11283,398438 -35,394943
11369,531250 -34,904671
11455,664063 -35,479427
11541,796875 -35,473644
11627,929688 -35,384167
11714,062500 -36,840118
11800,195313 -35,943314
11886,328125 -34,643333
11972,460938 -34,031979
12058,593750 -35,025551
12144,726563 -36,070576
12230,859375 -37,084480
12316,992188 -36,002167
12403,125000 -33,965801
12489,257813 -33,469131
12575,390625 -34,787479
12661,523438 -37,047661
12747,656250 -37,377193
12833,789063 -36,377129
12919,921875 -36,459984
13006,054688 -36,965195
13092,187500 -37,047352
13178,320313 -37,405384
13264,453125 -38,129604
13350,585938 -38,616001
13436,718750 -38,758411
13522,851563 -38,989937
13608,984375 -38,311893
13695,117188 -38,408447
13781,250000 -39,430771
13867,382813 -38,771778
13953,515625 -36,843391
14039,648438 -38,168823
14125,781250 -38,493073
14211,914063 -39,225246
14298,046875 -39,700558
14384,179688 -39,535137
14470,312500 -39,394268
14556,445313 -39,091141
14642,578125 -39,068996
14728,710938 -39,064449
14814,843750 -40,078053
14900,976563 -40,685184
14987,109375 -40,989746
15073,242188 -40,964050
15159,375000 -40,684677
15245,507813 -40,598972
15331,640625 -40,755501
15417,773438 -41,132820
15503,906250 -41,775986
15590,039063 -42,221577
15676,171875 -42,110687
15762,304688 -42,382931
15848,437500 -42,961838
15934,570313 -44,198906
16020,703125 -43,683937
16106,835938 -43,178497
16192,968750 -44,007149
16279,101563 -46,544579
16365,234375 -48,204025
16451,367188 -49,016720
16537,500000 -50,985371
16623,632813 -52,299007
16709,765625 -51,781879
16795,898438 -50,499325
16882,031250 -51,014236
16968,164063 -49,486279
17054,296875 -49,119892
17140,429688 -49,245987
17226,562500 -50,891426
17312,695313 -53,219521
17398,828125 -56,820602
17484,960938 -58,682140
17571,093750 -55,567654
17657,226563 -54,394451
17743,359375 -55,586525
17829,492188 -54,513618
17915,625000 -52,398323
18001,757813 -53,201061
18087,890625 -54,011242
18174,023438 -55,639305
18260,156250 -56,664547
18346,289063 -57,448425
18432,421875 -58,559246
18518,554688 -58,202160
18604,687500 -60,007172
18690,820313 -59,877018
18776,953125 -63,687431
18863,085938 -70,873871
18949,218750 -65,950081
19035,351563 -68,278648
19121,484375 -75,373802
19207,617188 -75,483360
19293,750000 -74,717400
19379,882813 -72,428497
19466,015625 -64,261040
19552,148438 -62,335892
19638,281250 -64,639671
19724,414063 -66,617638
19810,546875 -60,944901
19896,679688 -57,324692
19982,812500 -59,758495
20068,945313 -61,324566
20155,078125 -62,867512
20241,210938 -62,367916
20327,343750 -60,698250
20413,476563 -65,927116
20499,609375 -75,352570
20585,742188 -76,616966
20671,875000 -76,496971
20758,007813 -76,448364
20844,140625 -76,678337
20930,273438 -76,344048
21016,406250 -76,477676
21102,539063 -76,251717
21188,671875 -75,770531
21274,804688 -74,833015
21360,937500 -75,051117
21447,070313 -76,208809
21533,203125 -75,957474
21619,335938 -74,304909
21705,468750 -73,921745
21791,601563 -74,354233
21877,734375 -75,549065
21963,867188 -75,422791



(wav)
frecuencia (hz) volumen (db)
86,132813 2,764327
172,265625 0,399396
258,398438 -5,512767
344,531250 -10,075079
430,664063 -11,366339
516,796875 -11,544224
602,929688 -13,777155
689,062500 -13,648472
775,195313 -12,054070
861,328125 -11,800494
947,460938 -12,610358
1033,593750 -11,278362
1119,726563 -13,631571
1205,859375 -15,688970
1291,992188 -17,003590
1378,125000 -16,999838
1464,257813 -18,099049
1550,390625 -15,074356
1636,523438 -15,704657
1722,656250 -18,389826
1808,789063 -18,340666
1894,921875 -19,344467
1981,054688 -20,209446
2067,187500 -18,477787
2153,320313 -17,683388
2239,453125 -17,783279
2325,585938 -17,622147
2411,718750 -18,403133
2497,851563 -18,866066
2583,984375 -18,334984
2670,117188 -18,258146
2756,250000 -19,297379
2842,382813 -20,009329
2928,515625 -20,488810
3014,648438 -19,263700
3100,781250 -17,970457
3186,914063 -18,597815
3273,046875 -18,427265
3359,179688 -18,370108
3445,312500 -18,783073
3531,445313 -19,222883
3617,578125 -19,978275
3703,710938 -18,636713
3789,843750 -18,464472
3875,976563 -20,260721
3962,109375 -19,455736
4048,242188 -19,184086
4134,375000 -20,244673
4220,507813 -19,956528
4306,640625 -19,319141
4392,773438 -17,116735
4478,906250 -18,244261
4565,039063 -21,496563
4651,171875 -21,350693
4737,304688 -19,763147
4823,437500 -21,919771
4909,570313 -22,215097
4995,703125 -21,857342
5081,835938 -19,997580
5167,968750 -21,030083
5254,101563 -23,180553
5340,234375 -23,605843
5426,367188 -23,198645
5512,500000 -22,560781
5598,632813 -23,293882
5684,765625 -25,650745
5770,898438 -26,077087
5857,031250 -25,238728
5943,164063 -24,631073
6029,296875 -25,601299
6115,429688 -26,333961
6201,562500 -25,312153
6287,695313 -26,417673
6373,828125 -26,297152
6459,960938 -25,764093
6546,093750 -25,955303
6632,226563 -26,493717
6718,359375 -23,859318
6804,492188 -22,200438
6890,625000 -25,450888
6976,757813 -26,744825
7062,890625 -26,489258
7149,023438 -26,418432
7235,156250 -26,283705
7321,289063 -27,148930
7407,421875 -26,274864
7493,554688 -24,166214
7579,687500 -25,213001
7665,820313 -28,128468
7751,953125 -28,384735
7838,085938 -24,305756
7924,218750 -22,073027
8010,351563 -23,811794
8096,484375 -24,215466
8182,617188 -22,150146
8268,750000 -21,485207
8354,882813 -23,767820
8441,015625 -26,909956
8527,148438 -28,521450
8613,281250 -27,938854
8699,414063 -28,002811
8785,546875 -28,417683
8871,679688 -27,723671
8957,812500 -29,165710
9043,945313 -30,469641
9130,078125 -29,065672
9216,210938 -29,046434
9302,343750 -29,894236
9388,476563 -30,363241
9474,609375 -30,619766
9560,742188 -30,046795
9646,875000 -29,899944
9733,007813 -31,955772
9819,140625 -32,441280
9905,273438 -32,087772
9991,406250 -32,291245
10077,539063 -32,490391
10163,671875 -32,484604
10249,804688 -31,812820
10335,937500 -32,661938
10422,070313 -32,795895
10508,203125 -32,122425
10594,335938 -32,540398
10680,468750 -31,947451
10766,601563 -30,423555
10852,734375 -33,221310
10938,867188 -34,078346
11025,000000 -32,761002
11111,132813 -34,518639
11197,265625 -35,511284
11283,398438 -35,394936
11369,531250 -34,904697
11455,664063 -35,479412
11541,796875 -35,473633
11627,929688 -35,384182
11714,062500 -36,840118
11800,195313 -35,943295
11886,328125 -34,643322
11972,460938 -34,031979
12058,593750 -35,025551
12144,726563 -36,070587
12230,859375 -37,084469
12316,992188 -36,002144
12403,125000 -33,965801
12489,257813 -33,469112
12575,390625 -34,787437
12661,523438 -37,047649
12747,656250 -37,377167
12833,789063 -36,377121
12919,921875 -36,460033
13006,054688 -36,965237
13092,187500 -37,047359
13178,320313 -37,405384
13264,453125 -38,129585
13350,585938 -38,615990
13436,718750 -38,758453
13522,851563 -38,989922
13608,984375 -38,311905
13695,117188 -38,408394
13781,250000 -39,430706
13867,382813 -38,771751
13953,515625 -36,843403
14039,648438 -38,168865
14125,781250 -38,493050
14211,914063 -39,225197
14298,046875 -39,700489
14384,179688 -39,535011
14470,312500 -39,394188
14556,445313 -39,091099
14642,578125 -39,069031
14728,710938 -39,064503
14814,843750 -40,078014
14900,976563 -40,685055
14987,109375 -40,989620
15073,242188 -40,964020
15159,375000 -40,684658
15245,507813 -40,598839
15331,640625 -40,755417
15417,773438 -41,132767
15503,906250 -41,776012
15590,039063 -42,221664
15676,171875 -42,110653
15762,304688 -42,382874
15848,437500 -42,961781
15934,570313 -44,198875
16020,703125 -43,683968
16106,835938 -43,178543
16192,968750 -44,007290
16279,101563 -46,544685
16365,234375 -48,203987
16451,367188 -49,016773
16537,500000 -50,985378
16623,632813 -52,299271
16709,765625 -51,782093
16795,898438 -50,499283
16882,031250 -51,014091
16968,164063 -49,486149
17054,296875 -49,119907
17140,429688 -49,245895
17226,562500 -50,891529
17312,695313 -53,219795
17398,828125 -56,820904
17484,960938 -58,682251
17571,093750 -55,567612
17657,226563 -54,394558
17743,359375 -55,587078
17829,492188 -54,513565
17915,625000 -52,398163
18001,757813 -53,200954
18087,890625 -54,011383
18174,023438 -55,639702
18260,156250 -56,664925
18346,289063 -57,448586
18432,421875 -58,558964
18518,554688 -58,201649
18604,687500 -60,007126
18690,820313 -59,877342
18776,953125 -63,687576
18863,085938 -70,874001
18949,218750 -65,950500
19035,351563 -68,277618
19121,484375 -75,371445
19207,617188 -75,479126
19293,750000 -74,713112
19379,882813 -72,425064
19466,015625 -64,258926
19552,148438 -62,335617
19638,281250 -64,639404
19724,414063 -66,616676
19810,546875 -60,944553
19896,679688 -57,324348
19982,812500 -59,757851
20068,945313 -61,324066
20155,078125 -62,867069
20241,210938 -62,367817
20327,343750 -60,697536
20413,476563 -65,926094
20499,609375 -75,347794
20585,742188 -76,606773
20671,875000 -76,488640
20758,007813 -76,441750
20844,140625 -76,664619
20930,273438 -76,333954
21016,406250 -76,474098
21102,539063 -76,245758
21188,671875 -75,767670
21274,804688 -74,828987
21360,937500 -75,048660
21447,070313 -76,204056
21533,203125 -75,951363
21619,335938 -74,303070
21705,468750 -73,917870
21791,601563 -74,349236
21877,734375 -75,544006
21963,867188 -75,417267


canción 2
(mp3)
frecuencia (hz) volumen (db)
86,132813 -21,703619
172,265625 -16,825045
258,398438 -17,978113
344,531250 -19,284504
430,664063 -19,225838
516,796875 -21,799585
602,929688 -25,172213
689,062500 -24,492746
775,195313 -22,353573
861,328125 -24,997950
947,460938 -26,928482
1033,593750 -27,025902
1119,726563 -31,564646
1205,859375 -36,944664
1291,992188 -34,613136
1378,125000 -33,852215
1464,257813 -35,965153
1550,390625 -33,978901
1636,523438 -34,438885
1722,656250 -36,660164
1808,789063 -35,698681
1894,921875 -35,526970
1981,054688 -35,463619
2067,187500 -37,216400
2153,320313 -35,595062
2239,453125 -33,347572
2325,585938 -33,751320
2411,718750 -36,280491
2497,851563 -39,171288
2583,984375 -39,542942
2670,117188 -40,191494
2756,250000 -42,713726
2842,382813 -39,602982
2928,515625 -39,824371
3014,648438 -42,511490
3100,781250 -43,036137
3186,914063 -41,341393
3273,046875 -42,545628
3359,179688 -46,102879
3445,312500 -47,297974
3531,445313 -47,268494
3617,578125 -46,490520
3703,710938 -45,212978
3789,843750 -45,319260
3875,976563 -44,306164
3962,109375 -43,300934
4048,242188 -44,463276
4134,375000 -46,214832
4220,507813 -44,884003
4306,640625 -46,012302
4392,773438 -50,301720
4478,906250 -53,909088
4565,039063 -57,720196
4651,171875 -59,894283
4737,304688 -60,606277
4823,437500 -60,659912
4909,570313 -61,033409
4995,703125 -60,489845
5081,835938 -62,445187
5167,968750 -62,092396
5254,101563 -62,719784
5340,234375 -62,083294
5426,367188 -61,140850
5512,500000 -61,947525
5598,632813 -60,741138
5684,765625 -56,902149
5770,898438 -57,021297
5857,031250 -60,622795
5943,164063 -60,610958
6029,296875 -58,585865
6115,429688 -56,939465
6201,562500 -58,043659
6287,695313 -60,186047
6373,828125 -60,174187
6459,960938 -60,815025
6546,093750 -64,375671
6632,226563 -66,244240
6718,359375 -65,341522
6804,492188 -63,553207
6890,625000 -61,781158
6976,757813 -59,895706
7062,890625 -60,931721
7149,023438 -64,074471
7235,156250 -64,240845
7321,289063 -63,014618
7407,421875 -63,283218
7493,554688 -64,204826
7579,687500 -64,626411
7665,820313 -64,835068
7751,953125 -65,632973
7838,085938 -65,475159
7924,218750 -65,059059
8010,351563 -65,964104
8096,484375 -66,845726
8182,617188 -66,860168
8268,750000 -67,023712
8354,882813 -65,806145
8441,015625 -64,804291
8527,148438 -65,386505
8613,281250 -65,493011
8699,414063 -65,959641
8785,546875 -66,690842
8871,679688 -67,488464
8957,812500 -67,860458
9043,945313 -67,498619
9130,078125 -67,269028
9216,210938 -66,750946
9302,343750 -66,410988
9388,476563 -66,009842
9474,609375 -66,196541
9560,742188 -66,623802
9646,875000 -65,594582
9733,007813 -64,486305
9819,140625 -65,988380
9905,273438 -66,601067
9991,406250 -66,644989
10077,539063 -66,737228
10163,671875 -66,649879
10249,804688 -66,479630
10335,937500 -66,303505
10422,070313 -65,857971
10508,203125 -66,704895
10594,335938 -67,058136
10680,468750 -66,833069
10766,601563 -66,434608
10852,734375 -66,108429
10938,867188 -66,165512
11025,000000 -66,373856
11111,132813 -66,440430
11197,265625 -66,803810
11283,398438 -66,744850
11369,531250 -66,555496
11455,664063 -66,662384
11541,796875 -66,932831
11627,929688 -67,112366
11714,062500 -67,157837
11800,195313 -67,025818
11886,328125 -66,792290
11972,460938 -66,784210
12058,593750 -67,116989
12144,726563 -66,942207
12230,859375 -67,088631
12316,992188 -67,192314
12403,125000 -67,163719
12489,257813 -67,142464
12575,390625 -67,218605
12661,523438 -67,438736
12747,656250 -67,456711
12833,789063 -67,455048
12919,921875 -67,630989
13006,054688 -67,861862
13092,187500 -67,764153
13178,320313 -68,010689
13264,453125 -68,452545
13350,585938 -68,422417
13436,718750 -68,448982
13522,851563 -68,470184
13608,984375 -68,431015
13695,117188 -68,448235
13781,250000 -68,501434
13867,382813 -68,612984
13953,515625 -68,728241
14039,648438 -68,753334
14125,781250 -68,758995
14211,914063 -68,475273
14298,046875 -68,568848
14384,179688 -68,607239
14470,312500 -68,754478
14556,445313 -68,448845
14642,578125 -68,219398
14728,710938 -68,880997
14814,843750 -69,241859
14900,976563 -69,161880
14987,109375 -69,140343
15073,242188 -69,286011
15159,375000 -69,142372
15245,507813 -69,166092
15331,640625 -69,323059
15417,773438 -69,206833
15503,906250 -69,253273
15590,039063 -69,279701
15676,171875 -69,208130
15762,304688 -68,341408
15848,437500 -68,969322
15934,570313 -69,924873
16020,703125 -73,514542
16106,835938 -84,136093
16192,968750 -89,974686
16279,101563 -85,932274
16365,234375 -85,664307
16451,367188 -88,559341
16537,500000 -89,387955
16623,632813 -85,356148
16709,765625 -84,927551
16795,898438 -89,830376
16882,031250 -101,658531
16968,164063 -92,106712
17054,296875 -87,309647
17140,429688 -91,252441
17226,562500 -96,540970
17312,695313 -96,613342
17398,828125 -96,187225
17484,960938 -93,429550
17571,093750 -93,828094
17657,226563 -89,779037
17743,359375 -90,722862
17829,492188 -94,055031
17915,625000 -89,877831
18001,757813 -92,694550
18087,890625 -92,294067
18174,023438 -89,954025
18260,156250 -93,890518
18346,289063 -107,991669
18432,421875 -111,032722
18518,554688 -96,535767
18604,687500 -93,621338
18690,820313 -101,465286
18776,953125 -121,095650
18863,085938 -125,433960
18949,218750 -117,918449
19035,351563 -97,215820
19121,484375 -91,880562
19207,617188 -97,169792
19293,750000 -115,518387
19379,882813 -120,133842
19466,015625 -116,324257
19552,148438 -116,814079
19638,281250 -118,307877
19724,414063 -117,802719
19810,546875 -118,053970
19896,679688 -121,498238
19982,812500 -128,652893
20068,945313 -131,829514
20155,078125 -133,249619
20241,210938 -135,605515
20327,343750 -134,637848
20413,476563 -133,711166
20499,609375 -129,496902
20585,742188 -131,204208
20671,875000 -139,049088
20758,007813 -134,531464
20844,140625 -130,839645
20930,273438 -131,785706
21016,406250 -132,516495
21102,539063 -133,325043
21188,671875 -132,740311
21274,804688 -133,012421
21360,937500 -133,286484
21447,070313 -131,862778
21533,203125 -133,086304
21619,335938 -133,187836
21705,468750 -132,623474
21791,601563 -135,451370
21877,734375 -136,813919
21963,867188 -137,028046


(wav)
frecuencia (hz) volumen (db)
86,132813 -21,703609
172,265625 -16,825045
258,398438 -17,978107
344,531250 -19,284489
430,664063 -19,225832
516,796875 -21,799572
602,929688 -25,172213
689,062500 -24,492746
775,195313 -22,353569
861,328125 -24,997942
947,460938 -26,928507
1033,593750 -27,025923
1119,726563 -31,564651
1205,859375 -36,944664
1291,992188 -34,613106
1378,125000 -33,852192
1464,257813 -35,965137
1550,390625 -33,978912
1636,523438 -34,438911
1722,656250 -36,660179
1808,789063 -35,698689
1894,921875 -35,526974
1981,054688 -35,463619
2067,187500 -37,216469
2153,320313 -35,595036
2239,453125 -33,347546
2325,585938 -33,751320
2411,718750 -36,280445
2497,851563 -39,171219
2583,984375 -39,542877
2670,117188 -40,191471
2756,250000 -42,713684
2842,382813 -39,602959
2928,515625 -39,824387
3014,648438 -42,511528
3100,781250 -43,036255
3186,914063 -41,341450
3273,046875 -42,545628
3359,179688 -46,102837
3445,312500 -47,297955
3531,445313 -47,268471
3617,578125 -46,490448
3703,710938 -45,212826
3789,843750 -45,319263
3875,976563 -44,306236
3962,109375 -43,300915
4048,242188 -44,463371
4134,375000 -46,214905
4220,507813 -44,884052
4306,640625 -46,012356
4392,773438 -50,301476
4478,906250 -53,908916
4565,039063 -57,720108
4651,171875 -59,893730
4737,304688 -60,605934
4823,437500 -60,659260
4909,570313 -61,032978
4995,703125 -60,489697
5081,835938 -62,446194
5167,968750 -62,094311
5254,101563 -62,720322
5340,234375 -62,083115
5426,367188 -61,141117
5512,500000 -61,948334
5598,632813 -60,740997
5684,765625 -56,901772
5770,898438 -57,021111
5857,031250 -60,623524
5943,164063 -60,611294
6029,296875 -58,586182
6115,429688 -56,939125
6201,562500 -58,042942
6287,695313 -60,185669
6373,828125 -60,173725
6459,960938 -60,815586
6546,093750 -64,375694
6632,226563 -66,244530
6718,359375 -65,341446
6804,492188 -63,553505
6890,625000 -61,780815
6976,757813 -59,896378
7062,890625 -60,932838
7149,023438 -64,074081
7235,156250 -64,239670
7321,289063 -63,013229
7407,421875 -63,281410
7493,554688 -64,203484
7579,687500 -64,626419
7665,820313 -64,834618
7751,953125 -65,630577
7838,085938 -65,474068
7924,218750 -65,059097
8010,351563 -65,964081
8096,484375 -66,846443
8182,617188 -66,859344
8268,750000 -67,021774
8354,882813 -65,806427
8441,015625 -64,804764
8527,148438 -65,385956
8613,281250 -65,491676
8699,414063 -65,959343
8785,546875 -66,691811
8871,679688 -67,489647
8957,812500 -67,862274
9043,945313 -67,500626
9130,078125 -67,269516
9216,210938 -66,750648
9302,343750 -66,412628
9388,476563 -66,010437
9474,609375 -66,197487
9560,742188 -66,623222
9646,875000 -65,592209
9733,007813 -64,484261
9819,140625 -65,987602
9905,273438 -66,600426
9991,406250 -66,646080
10077,539063 -66,738533
10163,671875 -66,648903
10249,804688 -66,478653
10335,937500 -66,301010
10422,070313 -65,856125
10508,203125 -66,703163
10594,335938 -67,056816
10680,468750 -66,831070
10766,601563 -66,432892
10852,734375 -66,107979
10938,867188 -66,164909
11025,000000 -66,374062
11111,132813 -66,440765
11197,265625 -66,804176
11283,398438 -66,743484
11369,531250 -66,553467
11455,664063 -66,661110
11541,796875 -66,934708
11627,929688 -67,114273
11714,062500 -67,157333
11800,195313 -67,025711
11886,328125 -66,791969
11972,460938 -66,783310
12058,593750 -67,116486
12144,726563 -66,941872
12230,859375 -67,088661
12316,992188 -67,192673
12403,125000 -67,164833
12489,257813 -67,141983
12575,390625 -67,218102
12661,523438 -67,439041
12747,656250 -67,455956
12833,789063 -67,454651
12919,921875 -67,629814
13006,054688 -67,860596
13092,187500 -67,762321
13178,320313 -68,010056
13264,453125 -68,453568
13350,585938 -68,421150
13436,718750 -68,447021
13522,851563 -68,469170
13608,984375 -68,430489
13695,117188 -68,445137
13781,250000 -68,500481
13867,382813 -68,610153
13953,515625 -68,725998
14039,648438 -68,749458
14125,781250 -68,757507
14211,914063 -68,474236
14298,046875 -68,567696
14384,179688 -68,607071
14470,312500 -68,754974
14556,445313 -68,448936
14642,578125 -68,219322
14728,710938 -68,879753
14814,843750 -69,239937
14900,976563 -69,160461
14987,109375 -69,138779
15073,242188 -69,285316
15159,375000 -69,141701
15245,507813 -69,165878
15331,640625 -69,320122
15417,773438 -69,203720
15503,906250 -69,253319
15590,039063 -69,279411
15676,171875 -69,202652
15762,304688 -68,338318
15848,437500 -68,968636
15934,570313 -69,924210
16020,703125 -73,517525
16106,835938 -84,122162
16192,968750 -89,924431
16279,101563 -85,915955
16365,234375 -85,640877
16451,367188 -88,498543
16537,500000 -89,352371
16623,632813 -85,356628
16709,765625 -84,918121
16795,898438 -89,780884
16882,031250 -100,911423
16968,164063 -92,045860
17054,296875 -87,277924
17140,429688 -91,171555
17226,562500 -96,302094
17312,695313 -96,362732
17398,828125 -95,975540
17484,960938 -93,286919
17571,093750 -93,690636
17657,226563 -89,741318
17743,359375 -90,648819
17829,492188 -93,916069
17915,625000 -89,814964
18001,757813 -92,572395
18087,890625 -92,209480
18174,023438 -89,882896
18260,156250 -93,712318
18346,289063 -105,291161
18432,421875 -106,729126
18518,554688 -96,261421
18604,687500 -93,475113
18690,820313 -100,772865
18776,953125 -108,653290
18863,085938 -108,701027
18949,218750 -108,331978
19035,351563 -96,928490
19121,484375 -91,791862
19207,617188 -96,848930
19293,750000 -107,868881
19379,882813 -108,487793
19466,015625 -108,247192
19552,148438 -108,255737
19638,281250 -108,375793
19724,414063 -108,249519
19810,546875 -108,130859
19896,679688 -108,542702
19982,812500 -108,596748
20068,945313 -108,680527
20155,078125 -108,742737
20241,210938 -108,752815
20327,343750 -108,940086
20413,476563 -108,906891
20499,609375 -108,797394
20585,742188 -108,574226
20671,875000 -108,763283
20758,007813 -108,859756
20844,140625 -108,836517
20930,273438 -108,786469
21016,406250 -108,875443
21102,539063 -108,876678
21188,671875 -108,631523
21274,804688 -108,615562
21360,937500 -108,634392
21447,070313 -108,671692
21533,203125 -108,718597
21619,335938 -108,796371
21705,468750 -108,762642
21791,601563 -108,735626
21877,734375 -108,797997
21963,867188 -108,797707
Subir
fourier Baneado
#3 por fourier el 31/12/2009
Alguien escribió:
Mi objetivo es codificar con el mismo codigo una canción mp3, wav y si fuese posible ogg a partir de su espectro (frecuencia- intensidad), es decir un analisis de frecuencia.


Primero, el analisis espectral de una señal no periodica se realiza como has comentado por transformadas de fourier, en este caso supongo que tu estas haciendo transformadas de señales muestreadas, luego estas haciendo una transformada discreta de fourier, y en concreto usando un software como el audition tu estas empleando un algoritmos que es FFT, el cual se basa en transformadas discretas pero.... no es tan solo Fourier, tiene mas cosicas. Ademas haciendo tan solo el espectro de amplitud ( frecuencia-intensidad ) estas obteniendo tan solo la mitad de la informacion. Vas a necesitar el espectro de fase tambien si quieres volver al dominio temporal.
Por otro lado te recomendaria si realmente estas interesado en el asunto usar lenguajes mas aptos para el procesado de señales, como por ejemplo Matlab o Mathcad.

Alguien escribió:
Utilizo audacity, 512 muestra, ventana hanning, frecuencia lineal)

En este caso tambien puedes tener discrepancia, si bien has hecho bien de enventanar con ventanas de tipo coseno alzado como puede ser hanning o hamming, cual ha sido tu criterio para escoger 512 puntos de la ventana????? A medida que cojas mas puntos obtendras una mejore resolucion espectral, donde podras ver si realmente existen diferencias. En este aspecto si quieres te puedo proporcionar un documento que escribi hace años acerca de la importancia a la hora de elegir la ventana correcta en el procesado de señales. Lo unico que te pido es que si lo vas a emplear en tu trabajo me cites como fuente.

Alguien escribió:
l observar estas tablas hay muchas cosas que no comprendo. En teoria el mp3 lo que hace es recortar los picos de las frecuencias y cuanto mas alta es la frecuencia mas corta ¿verdad?

Esto no es cierto. El mpeg 1 layer III lo que hace es que divide la señal temporal de entrada en bandas de frecuencia, para ello realiza una FFT, una vez que lo tiene dividido en bandas espectrales, emplea la teoria del enmascaramiento y la naturaleza humana en la cual se afirma que las bandas mas " graves " enmascaran a las bandas mas " agudas " siempre que las primeras tengan un nivel superior. Esto es como si te situas en la entrada de un bosque, si los primeros arboles que ves son mas altos que los de dentro del bosque, tan solo vas a poder percibir los primeros arboles que ves, ya que estos hacen una sombra sobre el resto.
Una vez que sabemos que las frecuencias graves enmascaran a las frecuencias agudas, pasamos a codificar cada una de estas bandas agudas enmascaradas con menos bits, como por defecto al ir reduciendo el numero de bits se va a incrementar el ruido de cuantificacion nosotros podremos reducir tantos bits hasta que el enmascaramiento de las frecuencias graves deje de enmascarar el ruido de cuantificacion de cada una de las bandas.

Alguien escribió:
¿cual es la relación entre el rango dinamico de wav y mp3?
Hace poco estube leiendo en el foro un chabal que comprovo si existian diferencias estadisticas entre el rms de 1 canción en mp3 y wav y le salia que no.
Yo lo he hecho pero con mas de una canción y en algunas como la 1 que he puesto me sale que si, pero la 2 me sale que no (esto lo realizo calculando la t de student


La relacion entre el rango dinamico de wav y de mp3 si el algoritmo esta bien hecho deberia ser que ambos son iguales, ya que tu no estas tocando el espectro de amplitud, tu estas recodificando el espectro de amplitud y es con eso con lo que tu estas consiguiendo reducir la tasa de bits. Logicamente cuanta menor tasa de bits menos bits estas empleando y mayor sera el ruido de cuantificacion en cada banda....

Dices que has usado la t de student para modelizar tu variable aleatoria, pero que criterio has empleado para escoger ese modelo???? Yo por ejemplo hubiese cogido una gaussiana, ya que lo tienes a huevo. Si tu media de la señal ( componente de continua ) es cero, la desviacion tipica sera igual al valor rms de la señal, y estos dos parametros son los unicos que necesitas para calcularte la distribucion gaussiana. Ademas teniendo 10 segundos de material a 44100 muestras por segundo,tienes un numero elevado de muestras como para caracterizar tu señal de una manera totalmente gaussiana
Subir
BrunoFM
#4 por BrunoFM el 31/12/2009
antes de nada, muchas gracias fourier por tu explicación.
512 lo he escogido porque cuantas menos mustras tome, mas se pareceran las intensidades de mp3 con wav. Ahora ya entiendo las diferencias entre los 2 formatos, pero para crear mi nuevo codigo quiero establecer las mismas bases para los dos formatos de audio y cuanto mas se parezcan las intensidades mucho mejor, por eso he escogido 512.
En cuanto a gaussiana, nunca lo habia escuchado, hoy si tengo tiempo empezare a mirarmelo.
Pues me ayudarias mucho si me pudieses pasar tu documento acerca de que ventana eliges y no tendria nungún problema en citarte en la bibliografia.

La verdad es que me ha quedado bastante claro lo que me has explicado y he estado pensando como podria codificarlas con las mismas reglas los mp3 y wav y se me ha ocurrido que sino puedo con todas las frecuencias ya que las bajas enmascaran las altas y las varian , si solo cogiese las frecuencias bajas....LAS INTENSIDADES DE LOS 2 FORMATOS SERIAN =!! ¿no? Pero lo que no sabria calcular es cual puede ser la maxima intensidad en determinada frecuencia. ¿sABES REALIZAR ESE CALCULO? es decir, cual seria la mayor intensidad que podria ser registrada en la frecuencia 14728,710938.


reitero tio, muchas gracias por tu colaboración :D

feliiizz aññoo newww
Subir
fourier Baneado
#5 por fourier el 31/12/2009
Alguien escribió:
En cuanto a gaussiana, nunca lo habia escuchado, hoy si tengo tiempo empezare a mirarmelo.
Pues me ayudarias mucho si me pudieses pasar tu documento acerca de que ventana eliges y no tendria nungún problema en citarte en la bibliografia.


intenta modelar los valores de amplitud de la señal como una variable gaussiana, para empezar yo generaria un ruido blanco, en el cual la media es cero, y la desviacion tipica coincide con el valor rms.
esta noche o mañana cuando este en casa te envio al mail el documento

Alguien escribió:
512 lo he escogido porque cuantas menos mustras tome, mas se pareceran las intensidades de mp3 con wav


esto es porque estas reduciendo la resolucion espectral, cuantos menos puntos tenga la ventana menor resolucion espectral y menos precision tendras luego para comparar, no es lo mismo tener una transformada de 512 puntos que una de 1024, en la segunda tienes el doble de informacion....

Alguien escribió:
si solo cogiese las frecuencias bajas....LAS INTENSIDADES DE LOS 2 FORMATOS SERIAN =!! ¿no?


correcto

Alguien escribió:
Pero lo que no sabria calcular es cual puede ser la maxima intensidad en determinada frecuencia. ¿sABES REALIZAR ESE CALCULO? es decir, cual seria la mayor intensidad que podria ser registrada en la frecuencia 14728,710938.

Con un ruido blanco es muy sencillo, segun el teorema de la energia de Rayleigh la energia de una señal temporal es igual a la energia de la suma de todas las componentes espectrales. Como el ruido blanco es un espectro plano, con todas las frecuencias con la misma amplitud, entonces lo unico que tienes que hace es dividir la energia de la señal entre 2 y posteriormente dividirlo entre el ancho de banda ( para calcular la energia tendras que tener en cuenta que tu ventana es de 512 puntos. Si muestreas a 44100 tu "periodo" es 512/44100. El ancho de banda es exactamente la frecuencia de muestreo dividido entre 2). Con eso conseguiras tener la maxima amplitud espectral de cada una de las componentes de ruido blanco.
Subir
BrunoFM
#6 por BrunoFM el 31/12/2009
gracias tioo!!

ok, espero ese documento.


salu2!!
Subir
fourier Baneado
#7 por fourier el 31/12/2009
yo si me el trabajo es de libre eleccion lo que haria seria por ejemplo comparar los diferentes tipos de codificacion de mpeg layer I,II y III o incluso diferentes tipos de algoritmos segun el fabricante. es mas sencillo y puedes sacar conclusiones guapas
Subir
tonoalba
#8 por tonoalba el 31/12/2009
y este es el foro de principiantes!!! jajaja

perdonad por el offtopic. Vaya par de crack! :P
Subir
Real_Kcan
#9 por Real_Kcan el 31/12/2009
o_O joder...
Subir
fourier Baneado
#10 por fourier el 31/12/2009
bueno, realmente me puso un privado con el enlace, asi que no se muy bien en donde esta ubicado, acabo de ver que esta en principiantes, bueno no se, sea como fuere siempre es interesante debatir con gente un poco de teoria que te pueda desembocar en aprender algo nuevo, para eso estamos todos aqui :P

feliz año nuevo a todos
Subir
BrunoFM
#11 por BrunoFM el 02/01/2010
fourier, el documento que me has pasado sobre ventanas no lo puedo abrir, me pone que la extension es : archivo :shock:


gracias!
Subir
fourier Baneado
#12 por fourier el 05/01/2010
te he enviado un mail hace un par de dias, en el te comentaba que el archivo es un zip que lo tienes que descomprimir con un winzip. has conseguido abrirlo ya????
Subir
Zarpo
#13 por Zarpo el 05/01/2010
... No sabía que en hispasónic estaban permitidos los hilos en chino... ;)

(Offtopicazo...)
Subir
BrunoFM
#14 por BrunoFM el 05/01/2010
eii fourier!!
sisi!! no me acorde de responderte. genial, ya me lo he leido y me ha venido muy bien. he hecho bien en coger hanning :D

Perdona si es mucho pedir per me ha surjido una ultima duda respecto al calculo sobre la maxima intensidad que prodria ser registrada en una canción.
Si el ruido no es ruido blanco como se haria.
Por ejemplo, tu muestreas una canción a 512 en formato mp3 como las que pegue mas arriba y quieres saber cual seria la mayor cantidad de dB's que se podrian registrar en qualquier canción en 2670,117188 frecuencias.
Podrias hacer el calculo sino te molesta. Y mmm....estoy buscando cual es la frecuencia donde tanto el formato wav,mp3 y ogg no varian la intensidad, es decir, como solo me basare en las frecuencias bajas pork son = no habra diferencia pero nose cual es la limite done empieza a variar para cortat ahi.
Muchas gracias por tu ayuda tio!! ya podrias ser profe de mi insti :D



fourier, por curiosidad nada+, eres ingeniero de telecomunicaciones? es que estoy aabando bachillerato y es una de las carreras k tengo en mente y me gustaria hablar con alguien para orientarme.
Subir
fourier Baneado
#15 por fourier el 06/01/2010
Alguien escribió:
Perdona si es mucho pedir per me ha surjido una ultima duda respecto al calculo sobre la maxima intensidad que prodria ser registrada en una canción.
Si el ruido no es ruido blanco como se haria.
Por ejemplo, tu muestreas una canción a 512 en formato mp3 como las que pegue mas arriba y quieres saber cual seria la mayor cantidad de dB's que se podrian registrar en qualquier canción en 2670,117188 frecuencias.


No me entero de nada de lo que me estas pidiendo, pero ahi van algunas recomendaciones a ver si te sirven.
- No se si este trabajo te lo impuesto tu profesor o si lo has elegido, pero tal como te comente, para el nivel de conocimientos que tienes creo que te vendria mejor un trabajo como por ejemplo comparar diferentes algoritmos de compresion y ver la diferencia entre ellos en el espectro. Es mucho mas sencillo y te va a servir mas que esto que estas intentando hacer.
- No uses adobe audition, usa Matlab, es bastante mejor tiene una libreria llamada signal toolbox que te viene mejor para trabajar con señales en el tiempo y en la frecuencia.
- Cuando tu muestreas una cancion la estas muestreando mediante un conversor analogico digital. El conversor muestrea a una determinada frecuencia de muestreo que debera ser al menos el doble de la frecuencia maxima de tu cancion. El conversor primero pasa la señal por un filtro paso bajo, hace una discretizacion en el tiempo gracias al muestreo ( PAM ) y despues se hace una discretizacion de las amplitudes ( PCM ). La salida es una palabra de tantos bits como bits uses en la conversion. Un conversor no muestrea a 512 en formato mp3, un conversor digitaliza la señal en el tiempo, luego tu mediante un algoritmo de codificacion mp3 la pasas a este formato y por ultimo le estas aplicando una ventana de 512 puntos a tu algoritmo FFT para obtener el espectro. Son tres cosas diferentes.
El nivel maximo de amplitud en el entorno digital es siempre 0 dBFS, esto no implica que la cancion vaya a llegar hasta este nivel. Los 0 dBFS que son una unidad " virtual " se relacionan con el sentido fisico del nivel de amplitud de una señal electrica mediante la relacion que el conversor establece cuando es calibrado sus 0 dBFS con un nivel determinado de dBu de nivel de tension electrica ( 0 dBu=0.775 voltios ) . Sin embargo esto de calibrar el conversor no es mas que una ñapa para poder meter la dinamica de una señal electrica que sale por ejemplo de un previo, en un conversor alimentado con una tension de referencia determinada. El proceso de cuantificacion o de asignarle un codigo a una determinada muestra se hace de la siguiente manera. Se coje la tension de referencia que alimenta al integrado que realiza la conversion se divide entre 2^N donde N es el numero de bits empleados en la cuantificacion y lo que sale es lo que se conoce como el LSB. A la tension de referencia se le resta el LSB para obtener una funcion de entrada salida del cuantificador simetrica respecto al origen, a la tension que se obtiene de restar la tension de referencia menos el LSB se le otorga el valor maximo de la palabra codigo empleada en la cuantificacion. Cualquier valor que este por encima de este nivel de tension se codificara con esta palabra codigo, lo cual te va a producir logicamente un recorte, ya que si por ejemplo estas muestreando una señal sinusoidal y en la mitad del ascenso de la sinusoide has llegado al limite del conversor, el resto de la cresta de la sinusoide se va a cuantificar con este valor, recortandose como si le hubieses metido un hachazo.
Por ejemplo, si se tiene un conversor de 16 bits con una tension de referencia de 5 voltios, el calculo es: 5/2^16=76.3uV luego 5V-76.3uV lo podemos casi tomar por despreciable y para hallar los dBu hacemos 20log(5/0.775)=16.2 dBu.
Si tu previo saca señales de hasta +24 dBu entonces tienes que calibrar el conversor para que esos 24 dBu se corresponda con los 5 voltios de referencia. Logicamente el calibrado del conversor es ni mas ni menos un divisor resistivo hecho con un potenciometro que atenua la señal de entrada para que esos 24 dBu entren dentro del margen de hasta 16.2 dBu del conversor.

Alguien escribió:
estoy buscando cual es la frecuencia donde tanto el formato wav,mp3 y ogg no varian la intensidad, es decir, como solo me basare en las frecuencias bajas pork son = no habra diferencia pero nose cual es la limite done empieza a variar para cortat ahi.

teoricamente si el algoritmo esta bien hecho no deberia haber una diferencia apreciable, ya que aunque para altas frecuencias se este incrementando el nivel del ruido de la recuantificacion, generalmente este nivel esta bastante por debajo del nivel de la señal como para hacer necesario el incluirlo en los calculos. El ruido de la cuantificacion es exactamente igual a la mitad del LSB en el que ahora el numero de bits es igual al numero de bits empleado en cada banda para la recuantificacion. Si estas recuantificando con ordenes de 10-12 bits el ruido de cuantificacion como norma general no produce una variacion aparente en el nivel de esa parte del espectro, si el espectro posee un nivel optimo en esa banda....

Alguien escribió:
fourier, por curiosidad nada+, eres ingeniero de telecomunicaciones? es que estoy aabando bachillerato y es una de las carreras k tengo en mente y me gustaria hablar con alguien para orientarme.

yo desde luego te la recomiendo, y tambien te diria que ingenieros hay de dos tipos, los que sacan la carrera aprobando examenes y cuando la terminan no se acuerdan de nada y de los que aun acabada la carrera repasan material o siguen intentando instruirse para que no quede todo como un simple diploma en tu cuarto....

Sinceramente recomendaria dos cosas.
1) que alguien mueva esto a un lugar que no sea principiantes, puesto que va a acabar liando mas a los que se supone que estan empezando en esto
2) intenta cambiar de trabajo, habla con el profe, esto que quieres hacer es muy bonito pero muy complicado y por lo que veo aun necesitas mucho rodaje y muchos quebraderos de cabeza para llegar a una conclusion que realmente merezca la pena. yo en tu situacion me cojeria los codificadores de mp3 que hay ahora por el mercado y realizaria un estudio comparativo, es mas sencillo, y te va a aportar mucho mas, a parte de poder relacionarlo con gente de la calle. la gente quiere saber xq el lame es mejor que el wmencoder, no quieren saber si es la fft se ha realizado con una ventana de 512 puntos.
Subir
Hilos similares
Respuesta rápida

Regístrate o para poder postear en este hilo