Maschinelles Lernen: PyCaret 2.0 Low-Code-Bibliothek, automatisiert in ML-Workflow

Die offene Version der PyCaret-Bibliothek für maschinelles Lernen ist in Version 2.0 veröffentlicht. PyCaret ist ein durchgängig verschlüsseltes Tool zur Verwaltung von ML-Modellen im experimentellen Bereich und basiert auf dem Low-Code-Prinzip.

Mit dem Tool können Benutzer beispielsweise automatisch Code eingeben, indem sie Vorschläge für gängige Codezeilen hinzufügen, und Dienste anbieten, die von der Datenaufbereitung über die Modellauswahl bis zur Bereitstellung reichen. Während des Setups führt das Tool anscheinend automatisch die üblichen Vor-Daten-Transformationen durch, mit denen Entwickler arbeiten möchten.

PyCaret hat angekündigt, dass PyCaret zum Vorbereiten von Datensätzen verwendet werden kann, z. B. zum Aufteilen und Extrahieren von Testsätzen, zum Normalisieren von Daten oder eines Clusters und zum automatischen Entfernen von Rückständen. Aus etwa 20 Transformationsoptionen können Benutzer auswählen, welche Option das Tool mit seiner Datenaufzeichnung ausführen soll.

Mit PyCaret können Benutzer aus etwa 20 Optionen auswählen, wie das Tool Datensätze erstellen soll

(Bild: premadatascience.com, PyCaret-Team)

In den beobachteten ML-Szenarien kann PyCaret Modelle mit Standard-Hyperparametern zur Klassifizierung und Regression testen und die erhaltenen Leistungsindikatoren vergleichen. Dies soll den Benutzern offensichtlich dabei helfen, das am besten geeignete Modell für ihr jeweiliges Szenario auszuwählen, das als Funktion bezeichnet wird. compare_model,, ,,.

Zeichnen Sie den Modellcode in der PyCaret ML-Bibliothek

Zeichnen Sie den Modellcode in der PyCaret ML-Bibliothek

(Bild: premadatascience.com, PyCaret-Team)

Nach Angaben der Herausgeber eignet sich das Tool auch zum Trainieren von Modellen und zur Feinabstimmung von Hyperparametern. Es enthält auch Funktionen zur Datenanalyse und -interpretation und ermöglicht jetzt die Aufzeichnung von Experimenten. Neu, da Version 1.x auch Parameter für die Systemregistrierung und zur Korrektur von Ungleichgewichten in Datensätzen sind (fix_imbalance und fix_imbalance_method). Der Parameter save erweitert dies nun plot_model und die Möglichkeit, Grafiken als PNG- oder HTML-Dateien zu speichern: Wenn Benutzer diesen Wert auf True setzen, speichert PyCaret den aktuellen Zeitplan im aktiv bearbeiteten Arbeitsverzeichnis.

Anzeige des Beispielcodes in PyCaret, visuelle Darstellung der ausgewerteten Daten

Den Benutzern stehen verschiedene Visualisierungsoptionen zur Verfügung. Beispiel für die Ausgabe bei Verwendung der Funktion plot_model von PyCaret

(Bild: premadatascience.com, PyCaret-Team)

Um Konflikte mit der Ausführung von Anwendungen und deren Bibliotheken zu vermeiden, empfiehlt das PyCaret-Team, das Tool in einer virtuellen Umgebung zu installieren, in der es nicht auf andere Bibliotheken zugreifen kann. Beispielsweise kann die Installation einer Conda-Entwicklungsumgebung mit den folgenden Befehlen durchgeführt werden:

# create a conda environment
conda create --name yourenvname python=3.6

# activate environment
conda activate yourenvname

# install pycaret
pip install pycaret==2.0

# create notebook kernel linked with the conda environment python -m
ipykernel install --user --name yourenvname --display-name "display-name"

Wenn Sie Azure Notebooks oder Google Colab verwenden, können Sie die Installation mit dem folgenden Befehl ausführen: !pip install pycaret==2.0, Installation mit pip Integriert automatisch alle Abhängigkeiten.

Genauer Beispiele für Anwendungen finden Sie im angekündigten Blogbeitragalles Interessenten finden technische Details in den Publikationsnotizen in GitHub, wo das Projekt gehostet wird.


(sgan)

Zur Homepage

READ  SPD-Führer: "Ich war noch nie in der Hölle, um die Koalition zu zerstören"
Written By
More from Heinrich Rapp

Coronavirus-Reinfektion: Zwei wurden bei den mit Benelux infizierten Personen gewonnen

Wissenschaft Reinfektion in den Benelux-Ländern Zwei geborgene Menschen wurden erneut mit Corona...
Read More

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.