亚洲人成电影网站久久影视,欧美性大战xxxxx久久久√,欧美激情办公室videos

Maison

développement back-end

Golang

Traitement CSV volumineux à l'aide de Go

Linda Hamilton

Nov 27, 2024 am 12:54 AM

L'idée est?:

étant donné qu'un grand CSV factice (1 million de lignes) contient un échantillon de données client et effectue le traitement avec les objectifs ci-dessous?:

Extraire les données du CSV

Calculer combien de données/lignes

Regrouper combien de clients pour chaque ville

Trier les villes par nombre de clients du plus élevé au plus bas

Calculer le temps de traitement

Un exemple CSV des clients peut être téléchargé ici https://github.com/datablist/sample-csv-files

Charger et extraire des données

Apparemment, Go a une bibliothèque standard pour le traitement CSV. Nous n'avons plus besoin de dépendance tierce pour résoudre notre problème, ce qui est bien. La solution est donc assez simple?:

  // open the file to a reader interface
  c, err := os.Open("../data/customers-1000000.csv")
  if err != nil {
    log.Fatal(err)
  }
  defer c.Close()

  // load file reader into csv reader
  // Need to set FieldsPerRecord to -1 to skip fields checking
  r := csv.NewReader(c)
  r.FieldsPerRecord = -1
  r.ReuseRecord = true
  records, err := r.ReadAll()
  if err != nil {
    log.Fatal(err)
  }

Ouvrez le fichier à partir du chemin indiqué
Charger le fichier ouvert sur le lecteur CSV
Contient tous les enregistrements/lignes CSV extraits dans une tranche d'enregistrements pour un traitement ultérieur

FieldsPerRecord est défini sur -1 car je souhaite ignorer la vérification des champs sur la ligne, car le nombre de champs ou de colonnes peut être différent dans chaque format

Dans cet état, nous sommes déjà en mesure de charger et d'extraire toutes les données du CSV et sommes prêts pour le prochain état de traitement. Nous pourrons également savoir combien de lignes dans CSV en utilisant la fonction len(records).

Regroupement du nombre total de clients dans chaque ville

Nous pouvons désormais parcourir les enregistrements et créer la carte contenant le nom de la ville et le nombre total de clients qui ressemble à ceci?:

["Jakarta": 10, "Bandung": 200, ...]

Les données de la ville dans la ligne CSV sont situées dans le 7ème index et le code ressemblera à ceci

  // create hashmap to populate city with total customers based on the csv data rows
  // hashmap will looks like be ["city name": 100, ...]
  m := map[string]int{}
  for i, record := range records {
    // skip header row
    if i == 0 {
    continue
    }
    if _, found := m[record[6]]; found {
      m[record[6]]++
    } else {
      m[record[6]] = 1
    }
  }

Si le plan de la ville n'existe pas, créez une nouvelle carte et définissez le total du client sur 1. Sinon, incrémentez simplement le nombre total de villes données.

Maintenant, nous avons la carte m contenant une collection de villes et le nombre de clients à l'intérieur. à ce stade, nous avons déjà résolu le problème du regroupement du nombre de clients pour chaque ville.

Trier le client total le plus élevé

J'ai essayé de trouver s'il existe une fonction dans la bibliothèque standard pour trier la carte mais malheureusement je ne l'ai pas trouvée. Tri possible uniquement pour la tranche car nous pouvons réorganiser l'ordre des données en fonction de la position de l'index. Alors oui, faisons une tranche de notre carte actuelle.

// convert to slice first for sorting purposes
dc := []CityDistribution{}
for k, v := range m {
  dc = append(dc, CityDistribution{City: k, CustomerCount: v})
}

Maintenant, comment l'avons-nous trié par CustomerCount du plus élevé au plus bas?? L’algorithme le plus courant pour cela utilise le bubble short. Bien que ce ne soit pas le plus rapide, il pourrait faire l'affaire.

Bubble Sort est l'algorithme de tri le plus simple qui fonctionne en échangeant à plusieurs reprises les éléments adjacents s'ils sont dans le mauvais ordre. Cet algorithme ne convient pas aux grands ensembles de données car sa complexité temporelle moyenne et dans le pire des cas est assez élevée.

Référence?: https://www.geeksforgeeks.org/bubble-sort-algorithm/

En utilisant notre tranche, il bouclera sur les données et vérifiera la valeur suivante de l'index et l'échangera si les données actuelles sont inférieures à l'index suivant. Vous pouvez vérifier l'algorithme de détail sur le site de référence.

Maintenant, notre processus de tri pourrait être comme ?a

  // open the file to a reader interface
  c, err := os.Open("../data/customers-1000000.csv")
  if err != nil {
    log.Fatal(err)
  }
  defer c.Close()

  // load file reader into csv reader
  // Need to set FieldsPerRecord to -1 to skip fields checking
  r := csv.NewReader(c)
  r.FieldsPerRecord = -1
  r.ReuseRecord = true
  records, err := r.ReadAll()
  if err != nil {
    log.Fatal(err)
  }

à la fin de la boucle, la tranche finale nous donnera des données triées.

Calculer le temps de traitement

Calculer le temps de traitement est assez simple, nous obtenons l'horodatage avant et après l'exécution du processus principal du programme et calculons la différence. En Go, l'approche devrait être assez simple?:

["Jakarta": 10, "Bandung": 200, ...]

Le résultat

Exécutez le programme avec la commande

  // create hashmap to populate city with total customers based on the csv data rows
  // hashmap will looks like be ["city name": 100, ...]
  m := map[string]int{}
  for i, record := range records {
    // skip header row
    if i == 0 {
    continue
    }
    if _, found := m[record[6]]; found {
      m[record[6]]++
    } else {
      m[record[6]] = 1
    }
  }

Les informations imprimées indiqueraient le nombre de lignes, les données triées et le temps de traitement. Quelque chose comme ceci ci-dessous?:

Large CSV Processing Using Go

Comme prévu par les performances de Go, il a traité 1 million de lignes CSV en moins d'une seconde?!

Tous les codes complétés sont déjà publiés sur mon référentiel Github?:

https://github.com/didikz/csv-processing/tree/main/golang

Le?on apprise

Le traitement CSV dans Go est déjà disponible dans la bibliothèque standard, pas besoin d'utiliser une bibliothèque tierce
Le traitement des données est assez simple. Le défi était de savoir comment trier les données car il fallait le faire manuellement

Qu'est-ce qui vous vient à l'esprit??

Je pensais que ma solution actuelle pourrait être optimisée davantage car j'ai bouclé tous les enregistrements extraits au format CSV pour les mapper et si nous avons vérifié la source ReadAll(), elle a également une boucle pour créer la tranche basée sur le lecteur de fichier donné. De cette manière, des lignes de 1 Mil pourraient produire 2 x boucles pour des données de 1 Mil, ce qui n'est pas agréable.

Je pensais que si je pouvais lire les données directement à partir du lecteur de fichiers, cela n'aurait besoin que d'une seule boucle car je pourrais créer une carte directement à partir de celui-ci. Sauf que la tranche d'enregistrements sera utilisée ailleurs mais pas dans ce cas.

Je n'ai pas encore le temps de le comprendre, mais j'ai aussi pensé à certains inconvénients si je le fais manuellement?:

Il faudra probablement gérer davantage d'erreurs du processus d'analyse
Je ne sais pas dans quelle mesure cela réduira le temps de traitement pour considérer que la solution de contournement en vaudra la peine ou non

Bon codage?!

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefa?on, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Afficher plus

Article chaud

Guide de construction de Grass Wonder | Uma musume joli derby

4 Il y a quelques semaines By Jack chen

<??>: 99 nuits dans la forêt - tous les badges et comment les déverrouiller

4 Il y a quelques semaines By DDD

Uma Musume Pretty Derby Banner Schedule (juillet 2025)

1 Il y a quelques mois By Jack chen

Guide de température de Rimworld Odyssey pour les navires et Gravtech

3 Il y a quelques semaines By Jack chen

Windows Security est vide ou ne montre pas les options

1 Il y a quelques mois By 下次還敢

Afficher plus

Outils chauds

Bloc-notes++7.3.1

éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Laravel

1597

Tutoriel PHP

1488

Afficher plus

Related knowledge

Est le frontend ou le backend de Golang Jul 08, 2025 am 01:44 AM

Golang est principalement utilisé pour le développement back-end, mais il peut également jouer un r?le indirect dans le champ frontal. Ses objectifs de conception se concentrent sur les hautes performances, le traitement simultané et la programmation au niveau du système, et conviennent à la création d'applications arrière telles que les serveurs API, les microservices, les systèmes distribués, les opérations de base de données et les outils CLI. Bien que Golang ne soit pas le langage grand public de la file d'attente Web, il peut être compilé en JavaScript via GOPHERJS, exécuter sur WebAssembly via Tinygo, ou générer des pages HTML avec un moteur de modèle pour participer au développement frontal. Cependant, le développement frontal moderne doit encore s'appuyer sur JavaScript / TypeScript et son écosystème. Par conséquent, Golang convient plus à la sélection de la pile technologique avec un backend haute performance comme noyau.

Comment construire une API GraphQL à Golang Jul 08, 2025 am 01:03 AM

Pour construire un GraphQlapi en Go, il est recommandé d'utiliser la bibliothèque GQLGEN pour améliorer l'efficacité du développement. 1. Sélectionnez d'abord la bibliothèque appropriée, telle que GQLGEN, qui prend en charge la génération automatique de code basée sur le schéma; 2. Définissez ensuite GraphQlschema, décrivez la structure de l'API et le portail de requête, tels que la définition des types de post et des méthodes de requête; 3. Puis initialisez le projet et générez du code de base pour implémenter la logique métier dans Resolver; 4. Enfin, connectez GraphQlHandler à HttpServer et testez l'API via le terrain de jeu intégré. Les notes incluent les spécifications de dénomination des champs, la gestion des erreurs, l'optimisation des performances et les paramètres de sécurité pour assurer la maintenance du projet

Comment installer Go Jul 09, 2025 am 02:37 AM

La clé de l'installation de Go est de sélectionner la version correcte, de configurer les variables d'environnement et de vérifier l'installation. 1. Accédez au site officiel pour télécharger le package d'installation du système correspondant. Windows utilise des fichiers .msi, macOS utilise des fichiers .pkg, Linux utilise des fichiers .tar.gz et les décompressez vers / usr / répertoire local; 2. Configurer les variables d'environnement, modifier ~ / .Bashrc ou ~ / .zshrc dans Linux / macOS pour ajouter le chemin et Gopath, et Windows définit le chemin d'accès pour aller dans les propriétés du système; 3. Utilisez la commande gouvernementale pour vérifier l'installation et exécutez le programme de test Hello.go pour confirmer que la compilation et l'exécution sont normales. Paramètres et boucles de chemin tout au long du processus

GO sync.WaitGroup Exemple Jul 09, 2025 am 01:48 AM

Sync.WaitGroup est utilisé pour attendre qu'un groupe de Goroutines termine la tache. Son noyau est de travailler ensemble sur trois méthodes: ajouter, faire et attendre. 1.Add (n) Définissez le nombre de Goroutines à attendre; 2.Done () est appelé à la fin de chaque goroutine, et le nombre est réduit de un; 3.Wait () bloque la coroutine principale jusqu'à ce que toutes les taches soient effectuées. Lorsque vous l'utilisez, veuillez noter: ADD doit être appelé à l'extérieur du goroutine, évitez l'attente en double et assurez-vous de vous assurer que Don est appelé. Il est recommandé de l'utiliser avec un report. Il est courant dans la rampe simultanée des pages Web, du traitement des données par lots et d'autres scénarios, et peut contr?ler efficacement le processus de concurrence.

Opter pour un traitement audio / vidéo Jul 20, 2025 am 04:14 AM

Le c?ur du traitement audio et vidéo consiste à comprendre le processus de base et les méthodes d'optimisation. 1. Le processus de base comprend l'acquisition, le codage, la transmission, le décodage et la lecture, et chaque lien a des difficultés techniques; 2. Des problèmes courants tels que l'audio et l'aberration vidéo, le retard de latence, le bruit sonore, l'image floue, etc. peuvent être résolues par ajustement synchrone, optimisation de codage, module de réduction du bruit, ajustement des paramètres, etc.; 3. Il est recommandé d'utiliser FFMPEG, OpenCV, WebBrTC, GStreamer et d'autres outils pour atteindre des fonctions; 4. En termes de gestion des performances, nous devons prêter attention à l'accélération matérielle, à la définition raisonnable des fréquences d'images de résolution, à des problèmes de concurrence et de fuite de mémoire de contr?le. La ma?trise de ces points clés contribuera à améliorer l'efficacité du développement et l'expérience utilisateur.

Tutoriel de package d'intégration Jul 09, 2025 am 02:46 AM

L'utilisation du package Embed de Go peut facilement intégrer des ressources statiques dans le binaire, adapté aux services Web pour emballer HTML, CSS, images et autres fichiers. 1. Déclarez la ressource intégrée à ajouter // Go: Embed Commentaire avant la variable, telle que l'intégration d'un seul fichier hello.txt; 2. Il peut être intégré dans l'ensemble du répertoire tel que statique / *, et réaliser des emballages multi-fichiers via ENGED.fs; 3. Il est recommandé de changer le mode de chargement du disque via des variables BuildTag ou Environment pour améliorer l'efficacité; 4. Faites attention à la précision du chemin, aux limitations de la taille des fichiers et aux caractéristiques en lecture seule des ressources intégrées. L'utilisation rationnelle de l'intégration peut simplifier le déploiement et optimiser la structure du projet.

Comment créer un serveur Web dans Go Jul 15, 2025 am 03:05 AM

Il n'est pas difficile de créer un serveur Web écrit en Go. Le noyau réside dans l'utilisation du package net / http pour implémenter des services de base. 1. Utilisez Net / HTTP pour démarrer le serveur le plus simple: enregistrez les fonctions de traitement et écoutez les ports via quelques lignes de code; 2. Gestion du routage: utilisez Servmux pour organiser plusieurs chemins d'interface pour une gestion structurée facile; 3. Pratiques communes: routage de groupe par modules fonctionnels et utiliser des bibliothèques tierces pour prendre en charge l'appariement complexe; 4. Service de fichiers statique: Fournissez des fichiers HTML, CSS et JS via HTTP.FileServer; 5. Performances et sécurité: activer HTTPS, limiter la taille du corps de la demande et définir le délai d'attente pour améliorer la sécurité et les performances. Après avoir ma?trisé ces points clés, il sera plus facile d'élargir les fonctionnalités.

Allez sélectionner avec le cas par défaut Jul 14, 2025 am 02:54 AM

Le but de Select Plus Default est de permettre à Select d'effectuer un comportement par défaut lorsqu'aucune autre branche n'est prête à éviter le blocage du programme. 1. Lorsque vous recevez des données du canal sans blocage, si le canal est vide, il entrera directement la branche par défaut; 2. En combinaison avec le temps. Après ou Ticker, essayez d'envoyer des données régulièrement. Si le canal est plein, il ne bloque pas et ne sautera pas; 3. Empêcher les blocs de bloces, éviter le programme coincé lorsqu'il est incertain si le canal est fermé; Lorsque vous l'utilisez, veuillez noter que la branche par défaut sera exécutée immédiatement et ne peut pas être abusée, et que par défaut et le cas s'excluent mutuellement et ne seront pas exécutés en même temps.

See all articles

亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

Traitement CSV volumineux à l'aide de Go

Charger et extraire des données

Regroupement du nombre total de clients dans chaque ville

Trier le client total le plus élevé

Calculer le temps de traitement

Le résultat

Le?on apprise

Qu'est-ce qui vous vient à l'esprit??

Outils d'IA chauds

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

Article chaud

Outils chauds

Bloc-notes++7.3.1

SublimeText3 version chinoise

Envoyer Studio 13.0.1

Dreamweaver CS6

SublimeText3 version Mac

Sujets chauds