Descriptor de Archivo (File Descriptor)

Spread the love
  • Contiene información que describe las característicos o atributos de un archivo.
  • La información relacionada con el archivo se mantiene en el descriptor del  archivo, al que se apunta desde los directorios.
  • Es distinto en cada sistema operativo: nodo-i, registro Windows, etc.
  • Típicamente incluye atributos que varían de un sistema operativo a otro:
    • Nombre del Archivo representado en código ASCII.
    • Tipo de archivo – necesario en sistemas que proporciona distintos formatos de archivos.
    • Tamaño.
    • Localización.
    • Fecha y hora de creación/modificación
    • Dueño o propietario del archivo.
    • Información de protección – restricciones de acceso basadas en quin es permitido a accesar y que tipo de acceso es permitido.
    • Tamaño de registro – tamaño fijo o tamaño máximo dependiendo del tipo de registro.

Identificación de Archivos

  • Diferentes SO tienen sus propias reglas para nombrar archivos.
  • Algunas reglas son:

–        Combinación de caracteres

  • Por ejemplo, deben empezar con alfabético y después con alfanumérico.

–        Numero de partes:

  • MSDOS tiene dos partes: nombre y extensión.
  • UNIX tiene tantas partes como el usuario lo requiera.

–        Longitud, es decir, numero de caracteres permitidos.

  • MSDOS 8 caracteres 3 tres de extensión
  • Windows 32 caracteres
  • Sistemas anteriores de UNIX 6 caracteres
  • Nombre Absoluto (nombre completo) – nombre largo que incluye la ruta completa del archivo.
  • Nombre Relativo – nombre corto como es visto en la lista de directorio.

–        Seleccionado por el usuario al crearlo.

–        P.e., IMPUESTOS FEBRERO, ACUMUADOS 2004, o AUTOEXEC.

  • Extensión – 2-3  caracteres usados para identificar el tipo de archivo o su contenido.

–        Separado del nombre relativo por un punto.

–        P.e., CPP, BAS, BAT, COB, y EXE indican al sistema para utilizar un compilador especifico o programa para ejecutar esos archivos.

–        P.e., TXT, DOC, XLS, MIC, y PPT  creado por aplicaciones o por el usuario para su propia identificación.

Organización de Archivos

  • Como son los registros organizados dentro de un archivo:

–        Formato de registro.

–        Organización física del archivo.

  • La manera en que los registros son organizados y las características del medio usado para almacenarlo.

Formatos de Registro

  • Todos los archivos se componen de registros que son de dos tipos:

–        Registros de longitud fija: fáciles de acceder directamente

  • El tipo mas común e ideales para archivos de datos.
  • El tamaño del registro es critico: demasiado pequeño – truncacion; demasiado grande- desperdicio de espacio

–        Registros de longitud variable: dificultad para acceder directamente

  • No deja espacio de almacenamiento vacío y no trunca caracteres
  • Usados en archivos accesados secuencialmente o archivos usando índices para acceesar registros
  • El descriptor de archivos almacena el formato de registro.

Cuando los datos son almacenados en registros de longitud fija (a), los datos que se extienden mas allá del tamaño fijo, son truncados.

Cuando los datos son almacenados en registros de longitud variable (b), el tamaño del registro se expande para contener el tamaño del dato, pero toma mas tiempo en accesarlos.

Organización de Física de Archivos

  • La manera en que los registros son organizados depende de las características del medio usado para almacenarlos.
  • En discos magnéticos, los archivos pueden ser organizados de tres formas:

–        Secuencial,

–        Directo, o

Indexado secuencial.

  • Consideraciones al seleccionar un esquema de organización de archivos:

–        Volatilidad de los Datos – la frecuencia en la cual adiciones y eliminaciones son realizadas.

–        Actividad sobre el archivo – el porcentaje de registros procesados durante una corrida dada.

–        El tamaño del archivo.

–        El tiempo de respuesta:

  • Tiempo que el usuario esta dispuesto a esperar antes que la operación es completada.
  • Crucial cuando se realizan búsquedas y recuperaciones de datos en ambientes interactivos.

Organización secuencial de registros

  • Los registros son almacenados y accesados en forma serial, es decir un después del otro.

–        Es el esquema mas fácil de implementar

–        El archivo es buscado desde el inicio hasta que el registro solicitado es encontrado.

–        Características de optimización pueden ser implementadas para acelerar el proceso de búsqueda.

  • Seleccionar un campo llave del registro y ordenar el archivo bajo esa llave antes de almacenarlo.

–        Complica el algoritmo de mantenimiento

  • El orden debe ser preservado cada vez que un registro es agregado o borrado.

Organización Directa de Registro

  • Utiliza acceso directo de archivos; puede ser implementado solo en  dispositivos de almacenamiento de acceso directo

–        Permite el acceso de cualquier registro en cualquier orden sin tener que buscar desde el inicio del archivo

–        Los registros son identificados por sus direcciones relativas (direcciones relativas al inicio del archivo)

  • Esas direcciones lógicas son calculadas cuando los registros son almacenados y cuando son accesados

–        Se utilizan algoritmos de hashing.

  • Obtienen un identificador único por registro.
  • Ventajas de la organización Directa de registro:

–        Acceso mas rápido a registros

–        Puede ser accesado secuencialmente empezando en la primera dirección relativa e incrementando para obtener el siguiente registro

–        Puede ser actualizado mas rápidamente que los archivos secuenciales.

–        No se requiere preservar el orden de los registros, así que el agregar o borrar registros toma menos tiempo.

  • Desventaja:

–        Colisiones en caso de llaves similares

Indexado secuencial

  • Genera un archivo de índices para el acceso de registros
  • Combina las técnicas de acceso secuencial y directo

–        Divide el archivo en bloques de tamaños iguales

–        Cada entrada en el índice contiene la llave mas grande y la localización física en el bloque de datos.

–        Es creado y mantenido por software ISAM (Indexed Sequential Access Method )

Ventaja: no crea colisiones.

Asignación de Almacenamiento Físico

  • El Administrador de Archivos debe trabajar con archivos no solo como una unidad completa, sino también como unidades lógicas o registros.
  • Los registros dentro de un archivo debe tener el mismo formato pero pueden variar en longitud.
  • Los registros son subdivididos en Campos.
  • La estructura de registros es manejada usualmente por programas de aplicación y no por SO.
  • Cuando se habla de almacenamiento de archivos, se esta refiriendo a almacenamiento de registros.
  • Almacenamiento continuo
    • Los registros son almacenados uno después del otro en el disco
  • Almacenamiento no continuo
    • Los registros son almacenados en muchas partes del disco

Almacenamiento continúo

  • Los registros son almacenados uno después del otro.
  • Cualquier registro puede ser encontrado y leído una vez que la dirección inicial y su tamaño son conocidos.
  • Facilidad de Acceso directo – cada parte del archivo es almacenado en la misma area compacta.
  • Los archivos no pueden ser expandidos a menos que exista espacio vació disponible inmediatamente adelante de el.

–        Espacio para expansión debe ser provisto al crear el archivo.

  • Puede ocurrir fragmentación (espacio de almacenamiento sin uso).

Almacenamiento no continúo

  • Permite a los archivos usar cualquier espacio de disco disponible
  • Los registros son almacenados en una manera continua si existe suficiente espacio vació
  • Cualquier registro remanente y todas las adiciones, son almacenadas en otras secciones del disco llamadas EXTENTS.

–        Ligadas a través de apuntadores

–        El tamaño de cada sección es determinado por el SO (normalmente 256 bytes)

Almacenamiento no continúo

Las secciones son ligadas de la siguiente manera:

  • Ligas a nivel de almacenamiento:

–        Cada sección  apunta a la siguiente en secuencia

–        Las entradas en el directorio consisten de Nombre de archivo, localización del primer sector, localización del ultimo sector y numero total de secciones

  • Ligas a nivel de directorio:

–        Coda sección es listada con su dirección física, tamaño y apuntador a la siguiente sección

–        Un apuntador nulo indica que es el ultimo

Almacenamiento Indexado

  • Permite acceso directo a los registros al brindar apuntadores que ligan cada sector de un archivo a un bloque de índices.
  • Cada archivo tiene su propio bloque de índices.

–        Consiste de direcciones de cada sector del disco que forma al archivo

–        Lista cada entrada en el mismo orden en el cual el sector es ligado

  • Cuando un archivo es creado, los apuntadores en el bloque de índices son puestos a null.
  • Cuando un sector es llenado, el apuntador es puesto a su apropiada dirección de sector.

Publicado

en

por

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *