Spezialisierung für NoSQL-, Big Data- und Spark-Grundlagen

Entdecken Sie neue Fähigkeiten mit 30% Rabatt auf Kurse von Branchenexperten. Jetzt sparen.

Spezialisierung für NoSQL-, Big Data- und Spark-Grundlagen

Sprungbrett für Ihre Big Data-Karriere. Beherrschen Sie die Grundlagen von NoSQL, Big Data und Apache Spark und erwerben Sie praktische Fähigkeiten im Bereich maschinelles Lernen und Data Engineering.

Unterrichtet in Deutsch (KI-Synchronisation)

Dozenten: IBM Skills Network Team

12.992 bereits angemeldet

Bei Coursera Plus enthalten

Mehr erfahren

3-teilige Kursreihe

Befassen Sie sich eingehend mit einem Thema

4.4

(203 Bewertungen)

Stufe Anfänger

Empfohlene Erfahrung

1 Monat bei 10 Stunden pro Woche

Flexibler Zeitplan

Verdienen Sie sich einen beruflichen Leistungsnachweis

Teilen Sie Ihr Fachwissen mit Arbeitgebern

3-teilige Kursreihe

Befassen Sie sich eingehend mit einem Thema

4.4

(203 Bewertungen)

Stufe Anfänger

Empfohlene Erfahrung

1 Monat bei 10 Stunden pro Woche

Flexibler Zeitplan

Verdienen Sie sich einen beruflichen Leistungsnachweis

Teilen Sie Ihr Fachwissen mit Arbeitgebern

Was Sie lernen werden

Arbeiten Sie mit NoSQL-Datenbanken, um Daten einzufügen, zu aktualisieren, zu löschen, abzufragen, zu indizieren, zu aggregieren und zu splitten/partitionieren.
Entwickeln Sie praktische NoSQL-Erfahrung bei der Arbeit mit MongoDB, Apache Cassandra und IBM Cloudant.
Entwickeln Sie grundlegende Kenntnisse über Big Data und sammeln Sie praktische Erfahrungen im Umgang mit Apache Hadoop, MapReduce, Apache Spark, Spark SQL und Kubernetes.
Führen Sie Extrahieren, Transformieren und Laden (ETL) sowie Training und Einsatz von Machine Learning-Modellen mit Apache Spark durch.

Überblick

Big Data-Ingenieure und Fachleute mit NoSQL-Kenntnissen sind in der Datenverwaltungsbranche sehr gefragt. Diese Specialization richtet sich an diejenigen, die grundlegende Fähigkeiten für die Arbeit mit Big Data, Apache Spark und NoSQL-Datenbanken entwickeln möchten. In drei informationsreichen Kursen werden beliebte NoSQL-Datenbanken wie MongoDB und Apache Cassandra, das weit verbreitete Apache Hadoop-Ökosystem von Big Data-Tools sowie die Apache Spark-Analyse-Engine für die Verarbeitung großer Datenmengen behandelt.

Sie beginnen mit einem Überblick über die verschiedenen Kategorien von NoSQL-Datenspeichern (nicht nur SQL) und arbeiten dann praktisch mit mehreren von ihnen, darunter IBM Cloudant, MonogoDB und Cassandra. Sie führen verschiedene Datenverwaltungsaufgaben durch, wie z.B. das Erstellen und Replizieren von Datenbanken, Einfügen, Aktualisieren, Löschen, Abfragen, Indizieren, Aggregieren und Sharding von Daten. Als Nächstes erwerben Sie grundlegende Kenntnisse über Big-Data-Technologien wie Hadoop, MapReduce, HDFS, Hive und HBase, gefolgt von tiefer gehenden Kenntnissen über Apache Spark, Spark Dataframes, Spark SQL, PySpark, die Spark Application UI und die Skalierung von Spark mit Kubernetes. Im letzten Kurs lernen Sie die Arbeit mit Spark Structured Streaming Spark ML - für die Durchführung von Extract-, Transform- und Load-Verarbeitung (ETL) und maschinellen Lernaufgaben.

Diese Spezialisierung eignet sich für Anfänger in den Bereichen NoSQL und Big Data - egal ob Sie Dateningenieur, Softwareentwickler, IT-Architekt, Datenwissenschaftler oder IT-Manager sind oder sich darauf vorbereiten.

Kompetenzen, die Sie erwerben

Werkzeuge, die Sie lernen werden

Was ist inbegriffen?

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Deutsch (KI-Synchronisation)

36 Praxisübungen

Erweitern Sie Ihre Fachkenntnisse.

Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
Erwerben Sie ein Karrierezertifikat von IBM.

Spezialisierung - 3 Kursreihen

Bei dieser Specialization liegt der Schwerpunkt auf dem Lernen durch Handeln. Daher umfasst jeder Kurs praktische Übungen, in denen Sie die in den Vorlesungen erlernten NoSQL- und Big Data-Kenntnisse anwenden können.

Im ersten Kurs arbeiten Sie praktisch mit verschiedenen NoSQL-Datenbanken - MongoDB, Apache Cassandra und IBM Cloudant - und führen eine Vielzahl von Aufgaben aus: Erstellen der Datenbank, Hinzufügen von Dokumenten, Abfragen von Daten, Nutzung der HTTP-API, Ausführen von Create, Read, Update & Delete (CRUD) Operationen, Einschränken und Sortieren von Datensätzen, Indizierung, Aggregation, Replikation, Verwendung der CQL-Shell, Keyspace-Operationen und andere Tabellenoperationen.

Im nächsten Kurs starten Sie einen Hadoop-Cluster mit Docker und führen Map Reduce-Aufträge aus. Sie werden erkunden Sie die Arbeit mit Spark mithilfe von Jupyter-Notebooks auf einem Python-Kernel. Sie bauen Ihre Spark-Kenntnisse mit DataFrames und Spark SQL aus und skalieren Ihre Aufträge mit Kubernetes.

Im letzten Kurs werden Sie Spark für die ETL-Verarbeitung und das Training und die Bereitstellung von Machine Learning-Modellen mit IBM Watson verwenden.

Einführung in NoSQL-Datenbanken

KURS 118 Stunden4.6 (357 Bewertungen)Kurs ansehen

Was Sie lernen werden

Unterscheiden Sie zwischen den vier Hauptkategorien von NoSQL-Repositories.
Beschreiben Sie die Merkmale, Funktionen, Vorteile, Einschränkungen und Anwendungen der gängigsten Big Data-Verarbeitungstools.
Führen Sie allgemeine Aufgaben mit MongoDB-Aufgaben durch, einschließlich Erstellen, Lesen, Aktualisieren und Löschen (CRUD).
Führen Sie Keyspace-, Tabellen- und CRUD-Operationen in Cassandra aus.

Kompetenzen, die Sie erwerben

Kategorie: NoSQL

Kategorie: MongoDB

Kategorie: Apache Cassandra

Kategorie: Datenmodellierung

Kategorie: Skalierbarkeit

Kategorie: Abfragesprachen

Kategorie: Verteiltes Rechnen

Kategorie: Datenbank Management

Kategorie: JSON

Kategorie: Datenbanken

Kategorie: Datenbankarchitektur und -verwaltung

Kategorie: Datenmanipulation

Kategorie: IBM Cloud

Einführung in Big Data mit Spark und Hadoop

KURS 219 Stunden4.4 (454 Bewertungen)Kurs ansehen

Was Sie lernen werden

Erklären Sie die Auswirkungen von Big Data, einschließlich Anwendungsfällen, Tools und Verarbeitungsmethoden.
Beschreiben Sie die Architektur, das Ökosystem, die Praktiken und die benutzerbezogenen Anwendungen von Apache Hadoop, einschließlich Hive, HDFS, HBase, Spark und MapReduce.
Wenden Sie die Grundlagen der Spark-Programmierung an, einschließlich der Grundlagen der parallelen Programmierung für DataFrames, Datensätze und Spark SQL.
Verwenden Sie die RDDs und Datensätze von Spark, optimieren Sie Spark SQL mit Catalyst und Tungsten und nutzen Sie die Optionen der Entwicklungs- und Laufzeitumgebung von Spark.

Kompetenzen, die Sie erwerben

Kategorie: Apache Spark

Kategorie: Big Data

Kategorie: Verteiltes Rechnen

Kategorie: Apache Hadoop

Kategorie: Apache Hive

Kategorie: Fehlersuche

Kategorie: IBM Cloud

Kategorie: Skalierbarkeit

Kategorie: Datenverarbeitung

Kategorie: Kubernetes

Kategorie: PySpark

Kategorie: Docker (Software)

Kategorie: Leistungsoptimierung

Kategorie: Datenumwandlung

Maschinelles Lernen mit Apache Spark

KURS 315 Stunden4.5 (109 Bewertungen)Kurs ansehen

Was Sie lernen werden

Beschreiben Sie ML, erläutern Sie seine Rolle im Data Engineering, fassen Sie generative KI zusammen, diskutieren Sie die Einsatzmöglichkeiten von Spark und analysieren Sie ML-Pipelines und Modellpersistenz.
Bewerten Sie ML-Modelle, unterscheiden Sie zwischen Regressions-, Klassifizierungs- und Clustering-Modellen und vergleichen Sie Data Engineering-Pipelines mit ML-Pipelines.
Konstruieren Sie die Datenanalyseprozesse mit Spark SQL und führen Sie Regression, Klassifizierung und Clustering mit SparkML durch.
Demonstrieren Sie die Verbindung zu Spark-Clustern, bauen Sie ML-Pipelines auf, führen Sie die Merkmalsextraktion und -umwandlung durch, und modellieren Sie die Persistenz.

Kompetenzen, die Sie erwerben

Kategorie: Apache Spark

Kategorie: Maschinelles Lernen

Kategorie: Extrahieren, Transformieren, Laden

Kategorie: Prädiktive Modellierung

Kategorie: Datenumwandlung

Kategorie: Regressionsanalyse

Kategorie: Überwachtes Lernen

Kategorie: Unüberwachtes Lernen

Kategorie: Daten-Pipelines

Kategorie: PySpark

Kategorie: Feature Technik

Kategorie: Apache Hadoop

Kategorie: Angewandtes maschinelles Lernen

Kategorie: Datenverarbeitung

Kategorie: Generative KI

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

IBM Skills Network Team

IBM

83 Kurse1.481.318 Lernende

Muhammad Yahya

IBM

5 Kurse89.393 Lernende

von

IBM

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Mehr erfahren

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Erkunden Sie die Abschlüsse

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Mehr erfahren

Häufig gestellte Fragen

Die Spezialisierung erfordert einen Arbeitsaufwand von 36-42 Stunden, um sie abzuschließen. Wenn Sie 6-8 Stunden pro Woche arbeiten, können Sie sie innerhalb von 1-2 Monaten abschließen. Wenn Sie 3-4 Stunden pro Woche arbeiten, können Sie sie in 4-6 Monaten abschließen.

Grundlegende Computerkenntnisse, Grundkenntnisse in IT-Systemen, Arbeitserfahrung mit einem oder mehreren Betriebssystemen und Programmiersprachen wie Python, Datenkenntnisse, einige SQL-Kenntnisse und die Bereitschaft, sich online selbst weiterzubilden. Es sind keine Vorkenntnisse in Big Data oder NoSQL erforderlich.

Es wird empfohlen, dass Sie die Kurse in der Reihenfolge absolvieren, in der sie in der Specializations vorkommen. Kurs 2 ist eine Vorbedingung für Kurs 3.

Ja! Um loszulegen, klicken Sie auf die Programmkarte, die Sie interessiert, und melden Sie sich an. Sie können sich registrieren und das Programm abschließen, um ein Zertifikat zu erhalten, das Sie mit anderen teilen können. Oder Sie können das Programm besuchen, um das Programmmaterial kostenlos anzusehen. Wenn Sie sich für ein Programm anmelden, das Teil einer Spezialisierung ist, sind Sie automatisch auch für die gesamte Spezialisierung angemeldet. Besuchen Sie Ihr Lerner-Dashboard, um Ihren Fortschritt zu verfolgen.

Nein, Sie können diesen Kurs nicht kostenlos besuchen.Wenn Sie sich für das Programm registrieren, erhalten Sie Zugang zu allen Programmen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Wenn Sie die Programminhalte nur lesen und ansehen möchten, können Sie das Programm kostenlos besuchen. Wenn Sie sich die Gebühr nicht leisten können, ist die Beantragung finanzieller Unterstützung möglich.