Thursday, January 31, 2019

Daten (rechnen) - Wikipedia


Verschiedene Arten von Daten, die durch ein Computergerät visualisiert werden können

Data ( DAY -tə DAT -D 19659003] DAH -tə ; [1] die als Singular, Plural oder als Massen-Nomen behandelt werden) ist eine beliebige Folge von einem oder mehreren Symbolen, die durch bestimmte Interpretationsakte Bedeutung haben.

Daten (oder Datum - eine einzelne Dateneinheit) erfordern Interpretation, um zu Information zu werden. Um Daten in Informationen zu übersetzen, müssen mehrere bekannte Faktoren berücksichtigt werden. Die beteiligten Faktoren werden durch den Ersteller der Daten und die gewünschten Informationen bestimmt. Der Begriff Metadaten wird verwendet, um auf die Daten zu den Daten zu verweisen. Metadaten können impliziert, spezifiziert oder gegeben sein. Daten, die sich auf physikalische Ereignisse oder Prozesse beziehen, haben auch eine zeitliche Komponente. In fast allen Fällen ist diese zeitliche Komponente impliziert. Dies ist der Fall, wenn ein Gerät wie ein Temperaturlogger Daten von einem Temperatursensor empfängt. Wenn die Temperatur empfangen wird, wird angenommen, dass die Daten eine zeitliche Referenz von "jetzt" haben. Das Gerät zeichnet also Datum, Uhrzeit und Temperatur zusammen auf. Wenn der Datenlogger Temperaturen übermittelt, muss er auch Datum und Uhrzeit (Metadaten) für jede Temperatur angeben.

Digitale Daten sind Daten, die im Gegensatz zur analogen Darstellung mit dem Binärzahlensystem Einsen (1) und Nullen (0) dargestellt werden. In modernen Computersystemen (nach 1960) sind alle Daten digital. Daten in einem Computer werden in den meisten Fällen als parallele Daten verschoben. Daten, die zu oder von einem Computer übertragen werden, werden in den meisten Fällen als serielle Daten verschoben. Siehe Parallele Kommunikation und serielle Kommunikation. Daten, die von einem analogen Gerät, z. B. einem Temperatursensor, stammen, müssen einen "Analog-Digital-Wandler" oder "ADC" (siehe Analog-Digital-Wandler) durchlaufen, um die analogen Daten in digitale Daten umzuwandeln.

Daten, die Mengen, Zeichen oder Symbole darstellen, an denen Operationen von einem Computer ausgeführt werden, werden auf magnetischen, optischen oder mechanischen Aufzeichnungsmedien gespeichert und aufgezeichnet und in Form digitaler elektrischer Signale übertragen. [2] [2]

Ein Programm ist ein Datensatz, der aus einer Reihe codierter Softwareanweisungen zur Steuerung des Betriebs eines Computers oder einer anderen Maschine besteht. [3] Physische Computerspeicherelemente bestehen aus einer Adresse und einem Daten- / Datenwort Lager. Digitale Daten werden häufig in relationalen Datenbanken wie Tabellen oder SQL-Datenbanken gespeichert und können im Allgemeinen als abstrakte Schlüssel / Wert-Paare dargestellt werden.

Daten können in vielen verschiedenen Arten von Datenstrukturen organisiert werden, einschließlich Arrays, Graphen und Objekten. Datenstrukturen können Daten vieler verschiedener Arten speichern, einschließlich Zahlen, Strings und sogar andere Datenstrukturen. Daten werden über Peripheriegeräte in Computer ein- und ausgehen.

Bei einer alternativen Verwendung werden Binärdateien (die nicht für Menschen lesbar sind) manchmal als "Daten" bezeichnet, im Unterschied zu einem für Menschen lesbaren "Text". [4] Die Gesamtmenge an digitalen Daten wurde 2007 auf 281 geschätzt Milliarden Gigabyte (= 281 Exabyte). [5][6] Digitale Daten kommen in diesen drei Zuständen: ruhende Daten, während des Transports befindliche Daten und verwendete Daten.




Eigenschaften [ edit ]


Im Wesentlichen ist ein einzelnes Datum ein an einem bestimmten Ort gespeicherter Wert.

Grundsätzlich folgen Computer einer Folge von Anweisungen, die sie in Form von Daten erhalten. Ein Satz von Anweisungen zum Ausführen einer bestimmten Aufgabe (oder von bestimmten Aufgaben) wird als "Programm" bezeichnet. Im Normalfall besteht das Programm, wie es vom Computer ausgeführt wird, aus binärem Maschinencode. Die vom Programm manipulierten, aber nicht von der CPU ausgeführten Speicherelemente sind ebenfalls Daten. Programmanweisungen und die Daten, die das Programm bearbeitet, werden auf dieselbe Weise gespeichert. Daher ist es für Computerprogramme möglich, mit anderen Computerprogrammen zu arbeiten, indem ihre programmatischen Daten bearbeitet werden.

Die Grenze zwischen Programm und Daten kann verschwimmen. Ein Interpreter ist beispielsweise ein Programm. Die Eingabedaten für einen Interpreter sind selbst ein Programm, nur nicht in Muttersprachen ausgedrückt. In vielen Fällen handelt es sich bei dem interpretierten Programm um eine von Menschen lesbare Textdatei, die mit einem Texteditorprogramm bearbeitet wird (normalerweise in Verbindung mit Klartextdaten). Bei der Metaprogrammierung werden Programme in gleicher Weise als Daten bearbeitet. Programme wie Compiler, Linker, Debugger, Programmaktualisierer, Virenscanner und dergleichen verwenden andere Programme als ihre Daten.

Um Datenbytes in einer Datei speichern zu können, müssen sie in einem "Dateiformat" serialisiert werden. Normalerweise werden Programme in speziellen Dateitypen gespeichert, die sich von denen für andere Daten unterscheiden. Ausführbare Dateien enthalten Programme; Alle anderen Dateien sind auch Datendateien. Ausführbare Dateien können jedoch auch "Inline" -Daten enthalten, die in das Programm integriert sind. Einige ausführbare Dateien haben insbesondere ein Datensegment, das nominell Konstanten und Anfangswerte (beide Daten) enthält.

Zum Beispiel: Ein Benutzer könnte das Betriebssystem zuerst anweisen, ein Textverarbeitungsprogramm aus einer Datei zu laden und dann ein in einer anderen Datei gespeichertes Dokument mit dem Textverarbeitungsprogramm zu bearbeiten. In diesem Beispiel würde das Dokument als Daten betrachtet. Wenn das Textverarbeitungsprogramm auch über eine Rechtschreibprüfung verfügt, wird das Wörterbuch (Wortliste) für die Rechtschreibprüfung ebenfalls als Daten betrachtet. Die Algorithmen, die die Rechtschreibprüfung verwendet, um Korrekturen vorzuschlagen, wären entweder Maschinencodedaten oder Text in einer interpretierbaren Programmiersprache.


Datenschlüssel und Werte, Strukturen und Persistenz [ edit ]


Schlüssel in Daten geben den Kontext für Werte an. Unabhängig von der Struktur der Daten ist immer eine Komponente vorhanden. Datenschlüssel in Daten und Datenstrukturen sind wesentlich, um Datenwerten einen Sinn zu geben. Ohne einen Schlüssel, der direkt oder indirekt mit einem Wert oder einer Auflistung von Werten in einer Struktur verknüpft ist, werden die Werte bedeutungslos und sind keine Daten mehr. Das heißt, es muss mindestens eine Schlüsselkomponente vorhanden sein, die mit einer Wertkomponente verknüpft ist, damit sie als Daten betrachtet werden kann. Daten können auf verschiedene Arten in Computern dargestellt werden, wie in den folgenden Beispielen gezeigt:


RAM [ edit ]


  • Direktzugriffsspeicher enthält Daten, auf die der Computerprozessor einen direkten Zugriff hat. Ein Computerprozessor (CPU) darf nur Daten in sich (Prozessorregister) oder Speicher bearbeiten. Dies steht im Gegensatz zur Datenspeicherung, bei der der Prozessor bzw. die Prozessoren Daten zwischen dem Speichergerät (Platte, Band ...) und dem Speicher verschieben müssen. Ein RAM ist ein Array aus einem (1) oder mehreren Blöcken linearer benachbarter Positionen, die ein Prozessor lesen oder schreiben kann, indem er eine Adresse für die Lese- oder Schreiboperation bereitstellt. Der "zufällige" Teil des RAM bedeutet, dass der Prozessor zu jeder Zeit in beliebiger Reihenfolge an einem beliebigen Ort im Speicher arbeiten kann. (Siehe auch Speicherverwaltungseinheit). Das kleinste Datenelement im RAM ist das "Binary Bit". Die Möglichkeiten und Einschränkungen des Zugriffs auf den RAM sind prozessorspezifisch. Im Allgemeinen ist der Hauptspeicher oder RAM als ein Array von "Sätzen elektronischer Ein / Aus-Schalter" oder Positionen, die bei Adresse 0 (hexadezimal 0) beginnen, angeordnet. Je nach Prozessorarchitektur (CPU) kann jeder Standort normalerweise 8, 16, 32 oder 64 parallele Bits speichern. Daher hat jeder in einem Byte im RAM gespeicherte Wert eine übereinstimmende Stelle, ausgedrückt als Versatz von der ersten Speicherstelle in der Speicheranordnung, dh 0 + n, wobei n die Versetzung in die Anordnung von Speicherstellen ist.

Tasten [1965901719459013edit]


  • Datenschlüssel müssen keine direkte Hardwareadresse im Speicher sein. Indirekte, abstrakte und logische Schlüsselcodes können in Verbindung mit Werten gespeichert werden, um eine Datenstruktur zu bilden. Datenstrukturen haben vorgegebene Offsets (oder Verknüpfungen oder Pfade) vom Start der Struktur, in denen Datenwerte gespeichert sind. Daher besteht der Datenschlüssel aus dem Schlüssel der Struktur plus dem Versatz (oder den Links oder Pfaden) in der Struktur. Wenn eine solche Struktur wiederholt wird, wobei Variationen von [the data values and the data keys] innerhalb derselben sich wiederholenden Struktur gespeichert werden, kann das Ergebnis einer Tabelle ähneln, in der jedes Element der sich wiederholenden Struktur als Spalte und jede Wiederholung der Struktur betrachtet wird als eine Reihe der Tabelle betrachtet. In einer solchen Organisation von Daten ist der Datenschlüssel normalerweise ein Wert in einer (oder eine Zusammensetzung der Werte in mehreren der Spalten).

Organisierte wiederkehrende Datenstrukturen [ edit ] ] 19659028] Die tabellarische Ansicht von sich wiederholenden Datenstrukturen ist nur eine von vielen Möglichkeiten. Wiederholte Datenstrukturen können hierarchisch organisiert werden, sodass Knoten in einer Kaskade von Eltern-Kind-Beziehungen miteinander verbunden sind. Werte und möglicherweise komplexere Datenstrukturen sind mit den Knoten verknüpft. Somit liefert die Knotenhierarchie den Schlüssel zum Adressieren der Datenstrukturen, die den Knoten zugeordnet sind. Diese Darstellung kann als umgekehrter Baum betrachtet werden. Z.B. Moderne Dateisysteme für Computerbetriebssysteme sind ein bekanntes Beispiel. und XML ist eine andere.

Sortierte oder geordnete Daten [ edit ]


  • Daten weisen einige inhärente Merkmale auf, wenn sie nach einem Schlüssel sortiert werden. Alle Werte für die Teilmengen des Schlüssels werden zusammen angezeigt. Beim sequentiellen Durchlaufen von Datengruppen mit dem gleichen Schlüssel oder einer Änderung der Teilmenge des Schlüssels wird dies in Datenverarbeitungskreisen als break oder control break bezeichnet. Es erleichtert insbesondere die Aggregation von Datenwerten in Teilmengen eines Schlüssels.

Peripheral Storage [ edit ]


  • Bis zum Aufkommen von nichtflüchtigen Computerspeichern, wie USB-Sticks, bestand permanenter Datenspeicher Dies wird normalerweise durch das Schreiben der Daten auf externe Blockgeräte wie Magnetbänder und Plattenlaufwerke erreicht. Diese Geräte suchen typischerweise nach einem Ort auf dem magnetischen Medium und lesen oder schreiben dann Datenblöcke einer vorbestimmten Größe. In diesem Fall ist der Suchort auf dem Medium der Datenschlüssel und die Blöcke die Datenwerte. Frühe Dateisysteme oder Plattenbetriebssysteme werden verwendet, um zusammenhängende Blöcke auf dem Plattenlaufwerk für Datendateien zu reservieren. In diesen Systemen könnten die Dateien aufgefüllt werden und der Speicherplatz ausgeht, bevor alle Daten in sie geschrieben wurden. Daher wurde viel ungenutzter Datenraum unproduktiv reserviert, um diese Situation zu vermeiden. Dies wurde als Raw-Disk bezeichnet. Später führten Dateisysteme Partitionen ein. Sie reservierten Blöcke mit Plattendaten für Partitionen und verwendeten die zugewiesenen Blöcke wirtschaftlicher, indem sie Blöcke einer Partition nach Bedarf dynamisch einer Datei zuweisen. Um dies zu erreichen, musste das Dateisystem nachverfolgen, welche Blöcke von Datendateien in einem Katalog oder einer Dateizuordnungstabelle verwendet wurden oder nicht. Dies nutzte zwar den Plattenspeicherplatz besser aus, führte jedoch zu einer Fragmentierung der Dateien auf der gesamten Festplatte und zu einem damit einhergehenden Performance-Overhead aufgrund von Latenzzeiten. Moderne Dateisysteme reorganisieren fragmentierte Dateien dynamisch, um Dateizugriffszeiten zu optimieren. Weiterentwicklungen in Dateisystemen führten zu einer Virtualisierung von Laufwerken, bei denen ein logisches Laufwerk als Partitionen von mehreren physikalischen Laufwerken definiert werden kann.

Indizierte Daten [ edit


  • Abrufen a Eine kleine Untermenge von Daten aus einer viel größeren Menge impliziert das sequentielle Durchsuchen der Daten. Das ist unwirtschaftlich. Indizes sind eine Möglichkeit, Schlüssel und Ortsadressen aus Datenstrukturen in Dateien, Tabellen und Datensätzen zu kopieren und diese dann mit umgekehrten Baumstrukturen zu organisieren, um die Zeit zum Abrufen einer Teilmenge der Originaldaten zu reduzieren. Zu diesem Zweck muss der Schlüssel der Teilmenge der abzurufenden Daten bekannt sein, bevor der Abruf beginnt. Die bekanntesten Indizes sind der B-Baum und die dynamischen Hash-Schlüsselindizierungsmethoden. Indizierung ist ein weiterer kostspieliger Aufwand für das Ablegen und Abrufen von Daten. Es gibt andere Möglichkeiten, Indizes zu organisieren, z. Sortieren der Schlüssel oder Mengenkorrektur (oder sogar des Schlüssels und der Daten zusammen) und Verwenden einer binären Suche danach.

Abstraktion und Indirektion [ edit ]


  • Objektorientierung Zwei grundlegende Konzepte zum Verständnis von Daten und Software: 1) Die taxonomische Rangstruktur von Programmcode-Klassen, die ein Beispiel für eine hierarchische Datenstruktur ist; und 2) zur Laufzeit die Erzeugung von Datenschlüsselreferenzen auf speicherinterne Datenstrukturen von Objekten, die aus einer Klassenbibliothek instanziiert wurden. Erst nach der Instantiierung existiert ein ausführendes Objekt einer angegebenen Klasse. Nachdem die Schlüsselreferenz eines Objekts aufgehoben wurde, sind die Daten, auf die dieses Objekt verweist, keine Daten mehr, da die Datenschlüsselreferenz null ist. und daher existiert auch das Objekt nicht mehr. Die Speicherstellen, an denen die Daten des Objekts gespeichert wurden, werden dann als Müll bezeichnet und als nicht verwendeter Speicher klassifiziert, der für die Wiederverwendung verfügbar ist.

Datenbankdaten [ edit ]


Parallel verteilte Datenverarbeitung [19659017] [ edit ]


  • Moderne, skalierbare / Hochleistungs-Datenpersistenztechnologien basieren auf einer massiv parallelen verteilten Datenverarbeitung über viele Standardcomputer in einem Netzwerk mit hoher Bandbreite. Ein Beispiel ist Apache Hadoop. In solchen Systemen werden die Daten auf mehrere Computer verteilt, und daher muss ein bestimmter Computer im System entweder direkt oder indirekt im Schlüssel der Daten dargestellt werden. Dies ermöglicht die Unterscheidung zwischen zwei identischen Datensätzen, die jeweils auf einem anderen Computer verarbeitet werden.

Siehe auch [ edit ]



] edit ]









No comments:

Post a Comment