


Utilisation de jointures dans les bases de données MongoDB NOSQL
Feb 18, 2025 pm 12:59 PM
Points de base
- MongoDB, une base de données NOSQL, a introduit un nouvel opérateur
$lookup
dans la version 3.2, qui peut effectuer des opérations de type gauche sur deux ensembles ou plus, réalisant ainsi des données similaires aux bases de données relationnelles. Cependant, cet opérateur est limité à l'utilisation dans les opérations agrégées, qui sont plus complexes et généralement plus lentes que les requêtes de recherche simples. - L'opérateur de MongoDB
$lookup
nécessite quatre paramètres:localField
(saisir le champ de recherche dans le document),from
(la collection à connecter),foreignField
(les champs se trouvent dans la collection defrom
) etas
(nom du champ de sortie). Cet opérateur peut être utilisé dans les requêtes agrégées pour faire correspondre les publications, trier dans l'ordre, limiter le nombre d'éléments, connecter les données de l'utilisateur, aplatir les tableaux d'utilisateur et retourner uniquement les champs nécessaires. - Bien que l'opérateur
$lookup
de MongoDB soit utile et puisse aider à gérer une petite quantité de données relationnelles dans une base de données NoSQL, elle ne remplace pas la clause de jointure plus puissante dans SQL. Si le document utilisateur est supprimé dans MongoDB, le document de publication orphelin sera conservé, indiquant un manque de contraintes. Par conséquent, si l'opérateur$lookup
est fréquemment utilisé, il peut indiquer que le mauvais stockage de données est utilisé et qu'une base de données relationnelle (SQL) peut être plus appropriée.
Merci à Julian Motz pour son aide à l'examen par les pairs.
L'une des plus grandes différences entre les bases de données SQL et NOSQL est la jointure. Dans une base de données relationnelle, la clause de jointure SQL vous permet de combiner des lignes à partir de deux tables ou plus en utilisant un champ commun entre eux. Par exemple, si vous avez une table de livre et d'éditeur, vous pouvez écrire la commande SQL suivante:
SELECT book.title, publisher.name FROM book LEFT JOIN book.publisher_id ON publisher.id;
En d'autres termes, le tableau du livre a un champ Publisher_id qui fait référence au champ ID dans la table des éditeurs.
Ceci est pratique car un seul éditeur peut fournir des milliers de livres. Si nous devons mettre à jour les détails de l'éditeur à l'avenir, nous pouvons modifier l'enregistrement individuel. La redondance des données est minimisée car nous n'avons pas besoin de répéter les informations de l'éditeur pour chaque livre. Cette technologie est appelée standardisation.
Les bases de données SQL fournissent une gamme de normalisation et de contraintes pour assurer la maintenance des relations.
NOSQL == NON JOIN?
Ce n'est pas toujours le cas…
Les bases de données axées sur le document (telles que MongoDB) sont con?ues pour stocker des données dés-normalisées. Idéalement, il ne devrait pas y avoir de relation entre les ensembles. Si les mêmes données doivent être dans deux ou plusieurs documents, elles doivent être répétées.
Cela peut être frustrant car il n'y a presque aucune situation où vous n'aurez jamais besoin de données relationnelles. Heureusement, MongoDB 3.2 a introduit un nouvel opérateur qui peut effectuer des opérations de type gauche sur deux ensembles ou plus. Mais il y a un problème ... $lookup
AGLéGATION MONGODB
$lookup
autorisé uniquement à être utilisé dans les opérations agrégées. Considérez-le comme un pipeline d'une série d'opérateurs qui interrogent, filtrent et groupes de groupe. La sortie d'un opérateur est utilisée comme entrée pour l'opérateur suivant.
Les agrégations sont plus difficiles à comprendre que les requêtes de recherche simples et fonctionnent généralement plus lentement. Cependant, ils sont puissants et sont une option précieuse pour les opérations de recherche complexes.
Il est préférable d'utiliser un exemple pour expliquer l'agrégation. Supposons que nous créons une plate-forme de médias sociaux avec une collection d'utilisateurs. Il stocke les détails de chaque utilisateur dans un document séparé. Par exemple:
SELECT book.title, publisher.name FROM book LEFT JOIN book.publisher_id ON publisher.id;
Nous pouvons ajouter autant de champs que nous le souhaitons, mais tous les documents MongoDB nécessitent un champ _id
avec une valeur unique. _id
Similaire aux clés primaires SQL, elles seront insérées automatiquement si nécessaire.
Notre réseau social a maintenant besoin d'une collection de publications qui stockent un grand nombre de mises à jour perspicaces des utilisateurs. Le document stocke le texte, la date, la notation et les références à l'utilisateur qui l'a écrit dans le champ user_id
:
{ "_id": ObjectID("45b83bda421238c76f5c1969"), "name": "User One", "email": "userone@email.com", "country": "UK", "dob": ISODate("1999-09-13T00:00:00.000Z") }
Nous voulons maintenant afficher les vingt derniers messages évalués "importants" par tous les utilisateurs dans l'ordre inverse du temps. Chaque document renvoyé doit contenir du texte, l'heure de la publication et le nom et le pays de l'utilisateur associé.
La requête d'agrégation MongoDB passe un tableau d'opérateurs de pipeline qui définissent chaque opération dans l'ordre. Tout d'abord, nous devons utiliser le filtre $match
pour extraire tous les documents avec des notes correctes de la collection de post:
{ "_id": ObjectID("17c9812acff9ac0bba018cc1"), "user_id": ObjectID("45b83bda421238c76f5c1969"), "date": ISODate("2016-09-05T03:05:00.123Z"), "text": "My life story so far", "rating": "important" }
Nous devons maintenant trier les éléments correspondants dans l'ordre inverse en utilisant l'opérateur $sort
:
{ "$match": { "rating": "important" } }
Comme nous n'avons besoin que de vingt messages, nous pouvons appliquer la stade $limit
afin que MongoDB ne soit que pour traiter les données que nous voulons:
{ "$sort": { "date": -1 } }
Nous pouvons désormais utiliser le nouvel opérateur $lookup
pour connecter les données de la collecte des utilisateurs. Il nécessite un objet avec quatre paramètres:
-
localField
: Entrez le champ de recherche dans le document -
from
: Collection à connecter -
foreignField
: champs trouvés dansfrom
collection -
as
: le nom du champ de sortie.
Par conséquent, notre opérateur est:
{ "$limit": 20 }
Cela créera un nouveau champ dans notre sortie appelée userinfo
. Il contient un tableau où chaque valeur correspond au document utilisateur:
{ "$lookup": { "localField": "user_id", "from": "user", "foreignField": "_id", "as": "userinfo" } }
Nous avons une relation un à un post.user_id
et user._id
parce qu'un message ne peut avoir qu'un seul auteur. Par conséquent, notre tableau userinfo
ne contiendra toujours qu'un seul élément. Nous pouvons utiliser l'opérateur $unwind
pour le décomposer en un sous-document:
"userinfo": [ { "name": "User One", ... } ]
La sortie sera désormais convertie en un format plus pratique, avec d'autres opérateurs disponibles pour postuler:
{ "$unwind": "$userinfo" }
Enfin, nous pouvons utiliser la stade $project
dans le pipeline pour retourner le texte, l'heure du poste, le nom de l'utilisateur et le pays:
SELECT book.title, publisher.name FROM book LEFT JOIN book.publisher_id ON publisher.id;
Mettez tout ensemble
Notre requête globale finale correspond aux publications, trie dans l'ordre, limite les vingt derniers éléments, connecte les données utilisateur, afflige les tableaux d'utilisateurs et ne renvoie que les champs nécessaires. Commande complète:
{ "_id": ObjectID("45b83bda421238c76f5c1969"), "name": "User One", "email": "userone@email.com", "country": "UK", "dob": ISODate("1999-09-13T00:00:00.000Z") }
Le résultat est une collection de vingt documents pouvant aller. Par exemple:
{ "_id": ObjectID("17c9812acff9ac0bba018cc1"), "user_id": ObjectID("45b83bda421238c76f5c1969"), "date": ISODate("2016-09-05T03:05:00.123Z"), "text": "My life story so far", "rating": "important" }
génial! Je peux enfin passer à nosql!
MongoDB $lookup
est utile et puissant, mais même cet exemple de base nécessite une requête d'agrégation complexe. Il ne peut pas remplacer la clause de jointure la plus puissante dans SQL. MongoDB ne fournit pas non plus de contraintes; si le document utilisateur est supprimé, le document de publication orphelin sera conservé.
Idéalement, l'opérateur $lookup
doit être rarement nécessaire. Si vous en avez besoin fréquemment, vous avez peut-être utilisé le mauvais magasin de données ...
Si vous avez des données relationnelles, veuillez utiliser une base de données relationnelle (SQL)!
c'est-à-dire $lookup
est un ajout populaire à MongoDB 3.2. Il surmonte certains des problèmes les plus frustrants lors de l'utilisation d'une petite quantité de données relationnelles dans une base de données NOSQL.
FAQ sur l'utilisation de JOIN dans les bases de données MongoDB NOSQL (FAQ)
Quelle est la différence entre la connexion SQL et la connexion MongoDB?
Dans une base de données SQL, l'opération de connexion combine des lignes de deux tables ou plus en fonction des colonnes associées entre elles. Cependant, MongoDB, en tant que base de données NOSQL, ne prend pas en charge les connexions SQL traditionnelles. Au lieu de cela, MongoDB fournit deux fa?ons d'effectuer des opérations similaires: l'étape $lookup
et l'étape $graphLookup
dans l'agrégation. Ces méthodes vous permettent de combiner des données de plusieurs collections en un seul ensemble de résultats.
à MongoDB? $lookup
L'étape
dans MongoDB vous permet de connecter des documents à partir d'une autre collection (collection "connectée") et d'ajouter les documents connectés au document d'entrée. La phase $lookup
spécifie la "collection," Localfield "et" Foreignfield "pour correspondre au document, et le champ" AS "pour produire le document. Il est similaire à la jointure extérieure gauche dans SQL, renvoyant tous les documents de la collection d'entrée et des documents de correspondance de la collection "From". $lookup
Oui, MongoDB fournit une phase
pour la recherche récursive. L'étape $graphLookup
effectue une recherche récursive sur l'ensemble spécifié et peut choisir de limiter la profondeur et l'étendue de la recherche. Il est utile pour interroger des données hiérarchiques ou des graphiques où le nombre de niveaux est inconnu ou peut changer. $graphLookup
Pour optimiser les performances lors de l'utilisation des connexions MongoDB, considérez les stratégies suivantes: Utilisez des indices pour "Localfield" et "ForeignField" pour accélérer le processus de correspondance; ??> Stage
et $lookup
étapes pour filtrer et convertir des documents. $match
Puis-je connecter plusieurs collections dans MongoDB?
Oui, vous pouvez connecter plusieurs collections MongoDB en reliant plusieurs étapes $lookup
dans un pipeline d'agrégation. Chaque étape $lookup
ajoute des documents connectés d'une autre collection au document d'entrée.
Comment gérer les valeurs NULL ou manquantes lors de l'utilisation de la connexion MongoDB?
Lors de l'utilisation de la connexion MongoDB, si le document dans la collection d'entrée ne correspond à aucun document dans la collection "From", la phase $lookup
ajoute un tableau vide au champ "AS". Vous pouvez gérer ces valeurs nulles ou manquantes en ajoutant la phase $lookup
après la phase $match
pour filtrer les documents avec des champs vides "comme" champs.
Puis-je utiliser la connexion MongoDB avec des collections fragnées?
En commen?ant par MongoDB 3.6, les étapes $lookup
et $graphLookup
peuvent accepter les ensembles frappés comme "à partir de" ensembles. Cependant, en raison de la surcharge supplémentaire du réseau, les performances peuvent ne pas être aussi bonnes que les collections non ravières.
Comment trier les documents connectés dans MongoDB?
Vous pouvez trier les documents connectés dans MongoDB en ajoutant la phase $lookup
après la phase $sort
dans le pipeline d'agrégation. La scénario $sort
trie les documents dans le champ spécifié dans l'ordre croissant ou descendant.
Puis-je utiliser la connexion MongoDB avec la méthode find()
?
Non, la connexion MongoDB ne peut pas être utilisée avec la méthode find()
. Les étapes $lookup
et $graphLookup
font partie du cadre d'agrégation qui fournit des capacités de traitement des données plus avancées que la méthode find()
.
Comment déboguer ou dépanner l'échec de la connexion MongoDB?
Pour déboguer ou dépanner les défaillances de connexion MongoDB, vous pouvez utiliser la méthode explain()
pour analyser le plan d'exécution du pipeline agrégé. La méthode explain()
fournit des informations détaillées sur l'étape, y compris le nombre de documents traités, le temps passé et l'utilisation de l'index.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Qu'on le veuille ou non, l'intelligence artificielle fait partie de la vie quotidienne. De nombreux appareils - y compris les rasoirs électriques et les brosses à dents - sont devenus alimentés par l'IA, "en utilisant des algorithmes d'apprentissage automatique pour suivre comment une personne utilise l'appareil, comment le Devi

Un nouveau modèle d'intelligence artificielle (IA) a démontré la capacité de prédire les principaux événements météorologiques plus rapidement et avec une plus grande précision que plusieurs des systèmes de prévision mondiaux les plus utilisés. Ce modèle, nommé Aurora, a été formé u

Plus nous essayons de faire fonctionner les modèles d'IA, plus leurs émissions de carbone deviennent grandes - certaines invites générant jusqu'à 50 fois plus de dioxyde de carbone que d'autres, selon une étude récente.

La principale préoccupation concernant les grandes technologies expérimentant l'intelligence artificielle (IA) n'est pas qu'elle pourrait dominer l'humanité. Le vrai problème réside dans les inexactitudes persistantes des modèles de grands langues (LLM) tels que le chatppt d'Open AI, les Gémeaux de Google et

Plus l'intelligence artificielle plus avancée (AI) devient, plus elle a tendance à "halluciner" et à fournir des informations fausses ou inexactes. Selon la recherche par Openai, ses modèles de raisonnement les plus récents et puissants - O3 et O4-MINI - ont exhibés H

Les modèles de raisonnement de l'intelligence artificielle (IA) ne sont pas aussi capables qu'ils apparaissent. En réalité, leur performance se décompose complètement lorsque les taches deviennent trop complexes, selon les chercheurs d'Apple.Reassinging Models comme Anthropic's Claude, Open

La National Crime Agency (NCA) du Royaume-Uni a arrêté quatre personnes soup?onnées de participation aux cyberattaques ciblant les marques et Spencer (M&S), Co-Op et Harrods., selon une déclaration, les suspects incluent deux hommes de 19 ans, un 17 ans-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-O-On

La cryptographie post-quantum est devenue une priorité absolue pour les dirigeants de la cybersécurité, mais des recherches récentes indiquent que certaines organisations ne traitent pas la menace avec la gravité qu'il exige.
