1 / 97

Organização e Recuperação da Informação Memória Secundária

Organização e Recuperação da Informação Memória Secundária. Dr. Ednaldo Pizzolato. ORI - DISCOS. Memória Secundária Não Volátil Lenta Barata. Memória Primária Volátil Rápida Cara. ORI - DISCOS. ORI - DISCOS. ORI - DISCOS. UNIDADE BÁSICA DE MEMÓRIA

hertz
Download Presentation

Organização e Recuperação da Informação Memória Secundária

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Organização e Recuperação da InformaçãoMemória Secundária Dr. Ednaldo Pizzolato

  2. ORI - DISCOS • Memória Secundária • Não Volátil • Lenta • Barata • Memória Primária • Volátil • Rápida • Cara

  3. ORI - DISCOS

  4. ORI - DISCOS

  5. ORI - DISCOS • UNIDADE BÁSICA DE MEMÓRIA • O computador só pode identificar a informação através de sua restrita capacidade de destinguir entre dois estados, por exemplo, algo está imantado num sentido ou está imantado no sentido oposto. A uma dessas opções o computador associa o valor 1, e ao outro estado, o valor 0. • Os dígitos 0 e 1 são os únicos elementos do sistema de numeração de base 2, sendo então chamados de dígitos binários, ou abreviadamente, bit. Entenda-se por bit a unidade básica de memória, ou seja, a menor unidade de informação que pode ser armazenada num computador.

  6. ORI - DISCOS A tecnologia de gravação mais usada é a magnética, baseada em materiais que podem ser magnetizados (como o óxido de ferro e outros). Esta tecnologia foi usada inicialmente para a gravação de sons e depois adaptada para a gravação digital que os computadores exigem.

  7. ORI - DISCOS A superfície do disco, recoberta com uma fina camada de material magnetizável (quanto mais fina, melhor), é tratada como uma matriz de pontos. Cada ponto é considerado como um bit que pode ser definido como o equivalente magnético de 0 ou 1. Como a posição dos pontos não é determinada com precisão, o esquema de gravação envolve algumas marcas de orientação. Estas marcas são um dos motivos pelos quais um disco precisa ser formatado antes de poder ser utilizado.

  8. ORI - DISCOS Os discos (ao contrário das fitas que têm leitura/gravação linear) proporcionam acesso rápido por dois motivos: rotação e movimentação do cabeçote. Com a rotação, qualquer parte da circunferência do disco passa rapidamente por qualquer ponto determinado. A movimentação do cabeçote no sentido centro-borda aumenta ainda mais sua velocidade de acesso.

  9. ORI - Trilhas • A superfície dos discos é dividida em círculos concêntricos, as chamadas trilhas. Cada trilha é numerada, começando pelo círculo mais externo que recebe o número 0 (zero). O disquete de 1.44 Mb, por exemplo, possui 80 trilhas; os HDs costumam ter de 500 a mais de 1000 trilhas, dependendo do modelo. É bom lembrar que o perímetro da trilha 0 (a primeira e mais externa) é bem maior que o perímetro da trilha 79 (a última e mais central).

  10. ORI - Trilhas • A maioria das pessoas imagina que as trilhas cubram toda a superfície do disquete, mas não é bem assim. Basta fazer umas continhas sabendo que o disquete de 1.44 Mb e 3.5 polegadas grava dados na proporção de 135 trilhas por polegada, ou seja, poderia gravar cerca de 470 trilhas (135x3.5=472.5). Como existem 80 trilhas, a superfície que elas ocupam corresponde apenas a cerca de 0.6 polegadas, algo em torno de 1.5 cm dos 8.4 cm de superfície total.

  11. ORI - Setores • Cada uma das trilhas é dividida em porções menores - os setores. O tipo de disco determina o número de setores por trilha. O disquete de 3.5 polegadas e 1.44 Mb tem 18 setores por trilha e os HDs, novamente, podem ter números diferentes de setores dependendo do modelo além de poderem possuir mais setores nas trilhas mais externas.

  12. ORI - Setores • Os setores também são numerados. Os setores 0 (zero) de cada trilha estão reservados para identificação ao invés de armazenamento de dados. Eles têm sempre um tamanho fixo, que pode ser de 128 a 1024 bytes. O tamanho mais utilizado é de 512 bytes. Toda leitura e gravação é feita em termos de setores completos, mesmo que os dados ultrapassem setores e ocupem o último parcialmente.

  13. ORI - Lados • Nada impede a utilização das duas faces de um disco para armazenar dados. Deste modo, os chamados dupla face, possuem o lado 0 e o lado 1. Neles existem dois cabeçotes (por aste). Alguns HDs possuem um "sanduiche" de discos. Neste caso, os lados são numerados sequencialmente: lados 0 e 1 (do disco 1), lados 2 e 3 (do disco 2) e assim sucessivamente.

  14. ORI - Cilindros • O conjunto de trilhas com a mesma distância do centro em cada face do disco é chamado de cilindro. Imagine um HD com 3 discos de dupla face superpostos. Neste caso, existem 6 lados, numerados de 0 a 5. As trilhas de todas as faces ficam alinhadas na vertical, como se formassem tubos concêntricos. Cada um destes tubos é o chamado cilindro. Em outras palavras, um cilindro inclui uma trilha de cada uma das superfícies. Em um disquete, um cilindro sempre consiste de duas trilhas correspondentes, uma de cada lado.

  15. Calculando capacidades • Para calcular a capacidade bruta de qualquer disco, basta fazer algumas multiplicações. Tomemos como exemplo um disquete de dupla face com 80 trilhas por lado e 18 setores por trilha. Inicialmente multiplique o número de lados pelo número de trilhas por lado: 80 x 2 = 160. Agora multiplique o resultado pelo número de setores por trilha: 160 x 18 = 2880. Finalmente, multiplique o resultado pelo número de bytes por setor (512 bytes = 0.5 Kb): 2880 x 0.5 = 1440 Kb = 1.44 Mb.

  16. ORI - DISCOS

  17. ORI - DISCOS

  18. ORI - DISCOS

  19. ORI - DISCOS

  20. Evolução dos HDs

  21. ORI - DISCOS • Conceitos • Tempo de acesso (seek time): é o tempo gasto para a cabeça de leitura/gravação se posicionar na trilha correta. Varia de 3 ms (para trilhas adjacentes) e até 100 ms (para trilhas que estão nos extremos do disco). • Tempo de Latência Rotacional (rotational delay): é o tempo gasto para localizar o setor ao qual se quer ter acesso. O tempo total de acesso é a soma destes dois tempos (seek + latência rotacional). A latência rotacional varia de 0 ao tempo de uma rotação completa (a 3600 rpm, a LR é 16,67 ms). • Tempo de transferência (transfer time): é o tempo gasto para a migração dos dados da memória secundária para a memória principal. • Tempo de acesso: é a soma dos tempos: seek + latência + transferência. • Taxa de transferência: é a velocidade com a qual os dados migram da memória secundária para a memória principal. Ex.: 1.200 kbps.

  22. ORI - DISCOS • O tempo de acesso está relacionado com a velocidade de movimentação das cabeças de leitura e gravação do disco rígido. Podemos entender facilmente que quanto mais veloz for o movimento das cabeças, mais rapidamente o disco poderá acessar qualquer dado nele armazenado. Chamamos de tempo médio de acesso, ou simplesmente tempo de acesso, o tempo necessário para mover o braço desde o primeiro cilindro até o cilindro central.

  23. ORI - DISCOS • O tempo de acesso de uma memória é dependente do modo como o sistema de memória é construído e da velocidade dos seus circuitos. Ele varia bastante de acordo com o tipo de memória analisado, sendo valores típicos aqueles numa faixa entre 50 e 150 nanossegundos (ns), para a memória principal (ou memória DRAM); de 8 a 15 mili-segundos para discos magnéticos (memória secundária), enquanto fitas magnéticas têm tempo de acesso da ordem de poucos segundos.

  24. ORI - DISCOS • Ao lado do tempo médio de acesso, a taxa de transferência interna é o mais importante fator que define o desempenho de um disco rígido. • Enquanto o tempo médio de acesso é decisivo na leitura de arquivos pequenos em grande quantidade, a taxa de transferência interna é o principal fator envolvido na velocidade de leitura e gravação de arquivos grandes.

  25. ORI - DISCOS • Os discos rígidos possuem uma área interna de memória, para onde são lidos os dados que serão posteriormente transferidos para a placa de CPU. • Esta área é chamada de cache ou buffer.

  26. ORI - DISCOS • Quando um disco rígido IDE transfere dados, estão envolvidos dois tipos de transferência: • 1. Transferência da mídia magnética para a cache interna do disco • 2. Transferência da cache interna do disco para a placa de CPU

  27. ORI - DISCOS • A taxa de transferência interna representa a velocidade na qual a primeira transferência é feita. A velocidade na qual a segunda transferência se faz, é chamada de taxa de transferência externa. Para que o disco rígido possa fazer uma transferência completa (mídia - cache - CPU) de forma mais veloz, tanto a transferência interna como a externa precisam ser rápidas.

  28. ORI – DISCOS (BLOCOS) Bloco Uma seqüência contígua de setores de uma única trilha Os dados são trasferidos entre o disco e a memória principal em blocos Os tamanhos variam de 512 bytes até vários kilobytes • Blocos menores: mais transferências do disco • Blocos maiores: mais espaço desperdiçado, devido a blocos parcialmente cheios • Os tamanhos típicos de blocos hoje variam de 4 a 16 kilobytes

  29. ORI – DISCOS (BLOCOS) Bloco Algoritmos de Agendamento do braço do disco Ordenam os acessos pendentes para as trilhas para minimizar a movimentação do braço do disco. Algoritmo elevador: move o braço do disco em uma direção (das trilhas externas para as internas e vice-versa), processando a próxima requisição naquela direção, até que não haja mais requisições naquela direção, então reverte a direção e repete.

  30. ORI – DISCOS (blocos) • Suponha que tenhamos um disco organizado em blocos com capacidade para 20.000 bytes (por trilha) e que para armazenar um bloco o sistema gaste 300 bytes a mais com informações de suporte e espaçamento entre blocos. • Queremos armazenar um arquivo que tem registros de tamanho igual a 100 bytes. Quantos registros podem ser armazenados em cada trilha com fator de bloco igual a 10?

  31. ORI – DISCOS (blocos) • Se temos 100 bytes por registro e o fator de bloco é 10, então cada bloco armazena 1000 bytes de dados e mais 300 bytes de informação de controle. Assim, cada bloco utiliza 1300 bytes. Se temos 20.000 bytes em uma trilha, isso implica em 20.000 / 1.300 = 15.38 blocos. • Como precisamos de um número inteiro, teremos 15 blocos com 10 registros  150 registros por trilha.

  32. ORI – DISCOS (blocos) • E se o fator de bloco fosse 60? • Se fosse 60 teríamos 6000 bytes de dados (60 x 100) + 300 bytes de controle. • Assim, teríamos 20.000 / 6.300 = 3 • Ou sejam, 3 blocos com capacidade de 60 registros = 180 registros por trilha (contra 150 da versão anterior). É mais vantajoso utilizar o fator 60...

  33. ORI – DISCOS (organização) Organização de Arquivos Otimiza o tempo de acesso aos blocos organizando-os para corresponder à forma como os dados serão acessados. Por exemplo: armazenar informações relacionadas no mesmo cilindro ou em cilindros próximos. Fragmentação : Os blocos livres no disco ficam espalhados ou os arquivos novos têm seus blocos espalhados pelo disco: • Acesso seqüencial a um arquivo fragmentado resulta em maior movimentação do braço do disco Alguns sistemas possuem utilitários para desfragmentar o sistema de arquivos, para tornar mais rápido o acesso aos arquivos

  34. ORI – DISCOS (organização) Vamos analisar 2 situações diferentes de processamento de arquivo para demonstrar como o acesso à informação pode ser afetado pelo tempo de acesso. Situação 1 – Tempo para acessar o arquivo em seqüência. Situação 2 – Tempo para acessar o arquivo aleatoriamente.

  35. ORI – DISCOS (organização) O melhor desempenho para transferência de dados ocorre quando os arquivos estão em uma trilha. O arquivo tem 8.704.000 bytes e está dividido em 34.000 registros de 256 bytes cada. Primeiramente, é importante descobrir como o arquivo está distribuído no disco. Um bloco com 4096 bytes comporta 16 registros. O arquivo será armazenado de forma a ter uma seqüência de 2125 blocos que serão distribuídos em 100 trilhas.

  36. ORI – DISCOS (organização) Assumiremos que as 100 trilhas estão dispersas aleatoriamente no disco (situação extrema  apenas para enfatizar a conclusão). Devemos estimar o tempo que se deve consumir para ler o arquivo em seqüência (setor por setor). O processo envolve os seguintes tempos: seek time = 8 msec rotational delay = 3 msec leitura de uma trilha = 6 msec Total para uma trilha = 17 msec

  37. ORI – DISCOS (organização) Como desejamos a leitura de 100 trilhas temos : 100 x 17 msec = 1.7 segundos A segunda situação assume que os setores podem estar em posições distintas (não seqüencial), e assim, a cabeça de leitura terá que ficar “pulando” de uma posição para outra. Para ler um registro é preciso ler um bloco: seek time = 8 msec rotational delay = 3 msec leitura de um bloco = 1/21.5 x 6) = 0.28 msec total = 11.28 msec Como temos 34.000 registros, teremos 34.000 x 11.28 ms = 9,25 s

  38. ORI – CD-ROMS • Desenvolvido inicialmente pela Philips, e em seguida com a colaboração da Sony, os cd-roms têm se tornado muito populares. Seguros, duráveis, fáceis de armazenar e com alta capacidade de armazenamento, eles têm se tornado um grande meio de distribuição de programas.

  39. ORI – CD-ROMS • O nome cd-rom vem de compact disk read only memory. Como o próprio nome diz, ele é uma memória rom, isto é, memória somente de leitura (não pode ser alterada).

  40. ORI – CD-ROMS • Um cd é gravado utilizando um laser de alta potência. Com este laser são feitos “furos” (pits) em um disco. As áreas não “furadas” entre os pits são chamadas lands. Com os pits têm uma refletividade diferente dos lands, pode-se, assim, representar uma informação digital (dois estados).

  41. ORI – CD-ROMS • O processo de leitura é feito através da interpretação de altos e baixos relevos (PITS e LANDS), impressos no CD-ROM durante o processo de fabricação. Os PITS tem 0,12 microns por 0,6 microns de largura, sendo que a distância entre os mesmos corresponde à espiral de 1,6 microns representando uma taxa de 16000 TPI (trilhas por polegadas), muito maior de que hoje temos nos disquetes 5 1/4” 360 kbytes.

  42. ORI – CD-ROMS • É usado para leitura, um feixe de laser (Light Amplification by Stimulated Emission of Radar), circular de aproximadamente 1 mícron de diâmetro. Para se produzir esse feixe de laser é necessário aumentar a sua intensidade, que irá passar por uma série de lentes de altíssima qualidade, a fim de incidir sobre a face reflexiva do CD-ROM.

  43. ORI – CD-ROMS • Assim, de um lado temos o disco CD-ROM e do outro um feixe de laser incidindo sobre a espiral (PITS/LANDS), que é refletida pela camada de alumínio que compõe o CD-ROM.

  44. ORI – CD-ROMS • Quando o feixe incidir sobre uma microcavidade (baixo relevo “LAND”), ela será refletida ordenadamente com a mesma intensidade, voltando através do sistema de lentes e passando por um fotodetector que produzirá uma corrente elétrica de intensidade proporcional ao feixe recebido.

  45. ORI – CD-ROMS • De outro modo, quando o feixe incidir sobre um PIT (alto relevo) será refletido em diversas direções, dispersando a intensidade de luz refletida e, voltando pelo sistema óptico com uma baixa intensidade, irá gerar uma corrente elétrica de baixa intensidade.

  46. ORI – CD-ROMS • Quando se armazenam dados, em qualquer meio, eles devem ter uma forma que seja aceitável por esse meio. Em todas essas formas, é utilizado o sistema de representação binário (1/0). Nos CD’s temos os PITS e LANDS (espaço entre pits), que não correspondem a 1s e 0s. O conceito de representação binária dos 1s é através da mudança de estado de PIT para LAND ou, de LAND para PIT, e o tamanho do PIT ou LAND indica o número de 0s.

  47. ORI – CD-ROMS • Transições adjacentes, (PIT/LAND/PIT), não conseguem ser lidas pelo sistema óptico. Para solucionar este problema foi definido um tamanho mínimo de LAND (2 bits) e um tamanho máximo (11bits) para que durante a leitura dos dados não houvesse perda de sincronismo e que não prejudicasse o sistema de leitura do CD-ROM .

  48. ORI – CD-ROMS • Para que isso fosse realizado, foi adotada para o CD-ROM uma modulação de dados chamada EFM (Eight Fourteem Modulation), que transforma um byte (8 bits) de dados do usuário em 14 bits, que representam um caractere ou símbolo. A utilização da conversão EFM (8 para 14 bits), faz com que seja possível o tamanho mínimo (land máximo de 11 bits), mas como existe a possibilidade do fim da representação de um caractere (seqüência de 14 bits) terminar com “1” e o próximo caractere também iniciar com “1” para que isso não ocorra, é introduzido uma seqüência de três bits (merge bits) entre os caracteres.

  49. ORI - EFM • Eight to Fourteen Modulation 00000000 01001000100000 00000001 10000100000000 00000010 10010000100000 00000011 10001000100000 00000100 01000100000000 00000101 00000100010000 00000110 00010000100000 00000111 00100100000000 00001000 01001001000000 00001001 10000001000000 00001010 10010001000000

  50. ORI – CD-ROMS • A divisão lógica dos CD´s é totalmente diferente de um disquete ou disco rígido. Os dados não são gravados em trilhas e setores, mas numa espiral contínua, em blocos de dados. Um CD de 553 Mb, por exemplo, tem 270.000 blocos de dados.

More Related