Der vorherrschende Trend im maschinellen Lernen beinhaltet das übertragen von Daten in die Umgebung des Modells für das Training. Was ist jedoch, wenn wir diesen Prozess umkehren würden? W?re es nicht effizienter, die Modelle in die Datens?tze zu verschieben, da moderne Datenbanken erheblich gr??er sind als maschinelle Lernmodelle?
Dies ist das grundlegende Konzept hinter Postgresml - die Daten bleiben an ihrem Standort und Sie bringen Ihren Code in die Datenbank. Dieser umgekehrte Ansatz für maschinelles Lernen bietet zahlreiche praktische Vorteile, die konventionelle Vorstellungen einer "Datenbank" in Frage stellen.
postgresml: Ein überblick und ihre Vorteile
postgresml ist eine umfassende Plattform für maschinelles Lernen, die auf der weit verbreiteten Postgresql-Datenbank basiert. Es führt einen neuartigen Ansatz mit dem Namen "In-Database" -Maschinenlernen ein, mit dem Sie verschiedene ML-Aufgaben innerhalb von SQL ausführen k?nnen, ohne separate Tools für jeden Schritt zu ben?tigen.
Trotz seiner relativen Neuheit bietet Postgresml mehrere wichtige Vorteile:
- In-Database ML: Züge, Bereitstellungen und Ausführen von ML-Modellen direkt in Ihrer PostgreSQL-Datenbank. Dadurch wird die Notwendigkeit einer konstanten Datenübertragung zwischen der Datenbank und externen ML -Frameworks beseitigt, wodurch die Effizienz verbessert und die Latenz verringert wird.
- Dies vereinfacht Workflows für Datenanalysten und Wissenschaftler, die mit mehreren ML -Frameworks weniger vertraut sind.
- Vorausgebildete Modelle: Integriert nahtlos in das Huggingface und bietet Zugriff auf zahlreiche vorgebrachte Modelle wie Lama, Falcon, Bert und Mistral.
- Anpassung und Flexibilit?t: unterstützt eine Vielzahl von Algorithmen von Scikit-Learn, Xgboost, LGBM, Pytorch und TensorFlow, sodass verschiedene beaufsichtigte Lernaufgaben direkt innerhalb der Datenbank. erm?glicht.
- ?kosystemintegration: arbeitet mit jeder Umgebung zusammen, die Postgres unterstützt und SDKs für mehrere Programmiersprachen bietet (JavaScript, Python und Rost sind besonders gut unterstützt).
Dieses Tutorial zeigt diese Funktionen mit einem typischen Workflow:
- Datenladen
- Datenvorverarbeitung
- Modelltraining
- Hyperparameter Feinabstimmung
- Produktionserfassung
Alle diese Schritte werden in einer Postgres -Datenbank durchgeführt. Beginnen wir!
Ein vollst?ndiger beaufsichtigter Lernworkflow mit PostgreSml
Erste Schritte: postgresml Free Tier
- Erstellen Sie ein kostenloses Konto unter http://ipnx.cn/link/3349958a3e56580d4e415da345703886 :
- W?hlen Sie die kostenlose Stufe aus, die gro?zügige Ressourcen bietet:
Nach der Anmeldung zugreifen Sie auf Ihre Postgresml -Konsole, um Projekte und Ressourcen zu verwalten.
Mit dem Abschnitt "Verwalten" k?nnen Sie Ihre Umgebung basierend auf den Rechenanforderungen skalieren.
1. Installieren und Einrichten von Postgres
postgresml erfordert PostgreSQL. Installationsführer für verschiedene Plattformen sind verfügbar:
- Windows
- Mac OS
- Linux
Für WSL2 reicht die folgenden Befehle aus:
sudo apt update sudo apt install postgresql postgresql-contrib sudo passwd postgres # Set a new Postgres password # Close and reopen your terminal
überprüfen Sie die Installation:
psql --version
Für eine benutzerfreundlichere Erfahrung als das Terminal die VSCODE-Erweiterung berücksichtigen.
2. Datenbankverbindung
Verwenden Sie die Verbindungsdetails in Ihrer Postgresml -Konsole:
Verbinden Sie mit psql
:
psql -h "host" -U "username" -p 6432 -d "database_name"
Verwenden Sie alternativ die VSCODE -Erweiterung wie in ihrer Dokumentation beschrieben.
Aktivieren Sie die PGML -Erweiterung:
CREATE EXTENSION IF NOT EXISTS pgml;
überprüfen Sie die Installation:
SELECT pgml.version();
3. Datenladen
Wir werden den Diamonds -Datensatz von Kaggle verwenden. Laden Sie es als CSV herunter oder verwenden Sie diesen Python -Snippet:
import seaborn as sns diamonds = sns.load_dataset("diamonds") diamonds.to_csv("diamonds.csv", index=False)
Erstellen Sie die Tabelle:
CREATE TABLE IF NOT EXISTS diamonds ( index SERIAL PRIMARY KEY, carat FLOAT, cut VARCHAR(255), color VARCHAR(255), clarity VARCHAR(255), depth FLOAT, table_ FLOAT, price INT, x FLOAT, y FLOAT, z FLOAT );
Populate die Tabelle:
INSERT INTO diamonds (carat, cut, color, clarity, depth, table_, price, x, y, z) FROM '~/full/path/to/diamonds.csv' DELIMITER ',' CSV HEADER;
überprüfen Sie die Daten:
SELECT * FROM diamonds LIMIT 10;
4. Modelltraining
Grundausbildung
trainieren Sie einen Xgboost -Regressor:
SELECT pgml.train( project_name => 'Diamond prices prediction', task => 'regression', relation_name => 'diamonds', y_column_name => 'price', algorithm => 'xgboost' );
trainieren Sie einen Klassifikator mit mehreren Klassen:
SELECT pgml.train( project_name => 'Diamond cut quality prediction', task => 'classification', relation_name => 'diamonds', y_column_name => 'cut', algorithm => 'xgboost', test_size => 0.1 );
Vorverarbeitung
trainieren Sie ein zuf?lliges Waldmodell mit Vorverarbeitung:
SELECT pgml.train( project_name => 'Diamond prices prediction', task => 'regression', relation_name => 'diamonds', y_column_name => 'price', algorithm => 'random_forest', preprocess => '{ "carat": {"scale": "standard"}, "depth": {"scale": "standard"}, "table_": {"scale": "standard"}, "cut": {"encode": "target", "scale": "standard"}, "color": {"encode": "target", "scale": "standard"}, "clarity": {"encode": "target", "scale": "standard"} }'::JSONB );
postgresml bietet verschiedene Vorverarbeitungsoptionen (Codierung, Imputierung, Skalierung).
Angabe von Hyperparametern
trainieren Sie einen Xgboost -Regressor mit benutzerdefinierten Hyperparametern:
sudo apt update sudo apt install postgresql postgresql-contrib sudo passwd postgres # Set a new Postgres password # Close and reopen your terminal
Hyperparameter -Tuning
Führen Sie eine Gittersuche durch:
psql --version
5. Modellbewertung
Verwenden Sie pgml.predict
für Vorhersagen:
psql -h "host" -U "username" -p 6432 -d "database_name"
Um ein bestimmtes Modell zu verwenden, geben Sie seine ID an:
CREATE EXTENSION IF NOT EXISTS pgml;
Modell -IDs abrufen:
SELECT pgml.version();
6. Modellbereitstellung
postgresml bereitet automatisch das BEST-Performing-Modell bereit. Verwenden Sie für eine feinere Kontrolle pgml.deploy
:
import seaborn as sns diamonds = sns.load_dataset("diamonds") diamonds.to_csv("diamonds.csv", index=False)
Bereitstellungsstrategien umfassen best_score
, most_recent
und rollback
.
Weitere Erforschung von PostgreSml
postgresml erstreckt sich über das überwachte Lernen hinaus. Die Homepage verfügt über einen SQL -Editor zum Experimentieren. Der Aufbau eines ML-Dienstes mit Verbrauchern kann:
beinhalten- Erstellen einer Benutzeroberfl?che (z. B. mit Streamlit oder Taipy).
- Entwickeln eines Backends (Python, Node.js).
- Verwenden von Bibliotheken wie
psycopg2
oderpg-promise
für die Datenbankinteraktion. - Daten im Backend Vorverarbeitungsdaten.
- Ausl?sen
pgml.predict
bei der Benutzerinteraktion.
Schlussfolgerung
postgresml bietet einen neuartigen Ansatz zum maschinellen Lernen. Um Ihr Verst?ndnis zu f?rdern, erkunden Sie die Postgresml -Dokumentation und berücksichtigen Sie Ressourcen wie die SQL -Kurse und KI -Grundlagen von DataCamp.
Das obige ist der detaillierte Inhalt vonPostgresml Tutorial: maschinelles Lernen mit SQL machen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Erinnern Sie sich an die Flut chinesischer Open-Source-Modelle, die die Genai-Industrie Anfang dieses Jahres gest?rt haben? W?hrend Deepseek die meisten Schlagzeilen machte, war Kimi K1.5 einer der herausragenden Namen in der Liste. Und das Modell war ziemlich cool.

Reden wir darüber. Diese Analyse eines innovativen KI -Durchbruchs ist Teil meiner laufenden Forbes -S?ulenberichterstattung über die neueste in der KI, einschlie?lich der Identifizierung und Erkl?rung verschiedener wirksamer KI -Komplexit?ten (siehe Link hier). Auf dem Weg zu Agi und

Bis Mitte 2025 heizt sich das KI ?Wettret“ auf, und Xai und Anthropic haben beide ihre Flaggschiff-Modelle GROK 4 und Claude 4 ver?ffentlicht. Diese beiden Modelle befinden

Wir werden diskutieren: Unternehmen beginnen mit der Delegierung von Jobfunktionen für KI und wie KI Industrien und Arbeitspl?tze umgestaltet und wie Unternehmen und Arbeitnehmer arbeiten.

Aber wir müssen wahrscheinlich nicht einmal 10 Jahre warten, um einen zu sehen. Was als erste Welle wirklich nützlicher, menschlicher Maschinen angesehen werden k?nnte, ist bereits da. In den letzten Jahren wurden eine Reihe von Prototypen und Produktionsmodellen aus t herausgezogen

Bis zum Vorjahr wurde eine schnelle Engineering als entscheidende F?higkeit zur Interaktion mit gro?artigen Modellen (LLMs) angesehen. In jüngster Zeit sind LLM jedoch in ihren Argumentations- und Verst?ndnisf?higkeiten erheblich fortgeschritten. Natürlich unsere Erwartung

Viele Menschen haben leidenschaftlich ins Fitnessstudio gegangen und glauben, dass sie auf dem richtigen Weg sind, um ihre Fitnessziele zu erreichen. Die Ergebnisse sind jedoch nicht aufgrund schlechter Di?tplanung und mangelnder Richtung vorhanden. Einstellung eines Personal Trainer Al

Ich bin sicher, Sie müssen über den allgemeinen KI -Agenten Manus wissen. Es wurde vor einigen Monaten auf den Markt gebracht, und im Laufe der Monate haben sie ihrem System mehrere neue Funktionen hinzugefügt. Jetzt k?nnen Sie Videos erstellen, Websites erstellen und viel MO machen
