


Bagaimana Cara Membaca 10 Baris Terakhir Fail Teks 10GB dalam C# dengan Cekap?
Dec 29, 2024 am 02:03 AMMendapatkan semula 10 Baris Terakhir Fail Teks Besar-besaran (Melebihi 10GB)
Dalam bidang pemprosesan teks, cabaran biasa ialah mengekstrak beberapa baris terakhir fail teks yang sangat besar. Apabila berurusan dengan fail melebihi 10GB, pendekatan tradisional mungkin gagal. Artikel ini membentangkan penyelesaian yang berkesan untuk masalah ini menggunakan C# dan menawarkan coretan kod untuk menunjukkan pelaksanaannya.
Untuk mendapatkan semula 10 baris terakhir dengan cekap, strategi melibatkan melintasi fail ke belakang dari hujung. Oleh kerana bilangan baris mungkin berubah-ubah, kami secara berulang mencari ke belakang sehingga 10 pemisah baris ditemui. Setelah titik ini dicapai, kami membaca kandungan yang tinggal ke hadapan untuk menangkap 10 baris terakhir.
Pertimbangkan pelaksanaan berikut:
public static string ReadEndTokens(string path, Int64 numberOfTokens, Encoding encoding, string tokenSeparator) { int sizeOfChar = encoding.GetByteCount("\n"); byte[] buffer = encoding.GetBytes(tokenSeparator); using (FileStream fs = new FileStream(path, FileMode.Open)) { Int64 tokenCount = 0; Int64 endPosition = fs.Length / sizeOfChar; for (Int64 position = sizeOfChar; position < endPosition; position += sizeOfChar) { fs.Seek(-position, SeekOrigin.End); fs.Read(buffer, 0, buffer.Length); if (encoding.GetString(buffer) == tokenSeparator) { tokenCount++; if (tokenCount == numberOfTokens) { byte[] returnBuffer = new byte[fs.Length - fs.Position]; fs.Read(returnBuffer, 0, returnBuffer.Length); return encoding.GetString(returnBuffer); } } } // handle case where number of tokens in file is less than numberOfTokens fs.Seek(0, SeekOrigin.Begin); buffer = new byte[fs.Length]; fs.Read(buffer, 0, buffer.Length); return encoding.GetString(buffer); } }
Kod ini mengendalikan kes di mana bilangan baris dalam fail kurang daripada 10 dan melaraskan operasi baca dengan sewajarnya. Parameter pengekodan membenarkan penyesuaian berdasarkan pengekodan fail dan tokenSeparator boleh digunakan untuk mendapatkan semula elemen berturut-turut terakhir bagi pemisah yang berbeza.
Dengan menggunakan pendekatan ini, anda boleh mendapatkan semula 10 baris terakhir teks besar-besaran dengan berkesan. fail, memastikan pemprosesan yang cekap dan hasil yang tepat.
Atas ialah kandungan terperinci Bagaimana Cara Membaca 10 Baris Terakhir Fail Teks 10GB dalam C# dengan Cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

STD :: Chrono digunakan dalam C untuk memproses masa, termasuk mendapatkan masa semasa, mengukur masa pelaksanaan, titik masa operasi dan tempoh, dan masa analisis pemformatan. 1. Gunakan std :: chrono :: system_clock :: sekarang () untuk mendapatkan masa semasa, yang boleh ditukar menjadi rentetan yang boleh dibaca, tetapi jam sistem mungkin tidak membosankan; 2. Gunakan std :: chrono :: steady_clock untuk mengukur masa pelaksanaan untuk memastikan monoton, dan mengubahnya menjadi milisaat, saat dan unit lain melalui duration_cast; 3. Titik masa (time_point) dan tempoh (tempoh) boleh saling beroperasi, tetapi perhatian harus dibayar kepada keserasian unit dan zaman jam (Epoch)

Volatile memberitahu pengkompil bahawa nilai pembolehubah boleh berubah pada bila -bila masa, menghalang pengkompil daripada mengoptimumkan akses. 1. Digunakan untuk daftar perkakasan, pengendali isyarat, atau pembolehubah yang dikongsi antara benang (tetapi moden C mengesyorkan STD :: atom). 2. Setiap akses dibaca secara langsung dan tulis memori dan bukannya cache kepada daftar. 3. Ia tidak memberikan keselamatan atom atau benang, dan hanya memastikan bahawa pengkompil tidak mengoptimumkan bacaan dan menulis. 4. 5. Ia tidak boleh menggantikan operasi mutexes atau atom, dan penggunaan yang berlebihan akan menjejaskan prestasi.

Terdapat terutamanya kaedah berikut untuk mendapatkan jejak timbunan dalam C: 1. Gunakan fungsi backtrace dan backtrace_symbols pada platform Linux. Dengan memasukkan maklumat simbol panggilan dan percetakan, parameter -rdynamic perlu ditambah semasa menyusun; 2. Gunakan fungsi CaptureStackBackTrace pada platform Windows, dan anda perlu menghubungkan dbghelp.lib dan bergantung pada fail PDB untuk menghuraikan nama fungsi; 3. Gunakan perpustakaan pihak ketiga seperti GoogleBreakPad atau Boost.StackTrace untuk merentas platform dan memudahkan operasi menangkap stack; 4. Dalam Pengendalian Pengecualian, menggabungkan kaedah di atas untuk mengeluarkan maklumat timbunan secara automatik di blok tangkapan

Untuk memanggil kod Python di C, anda mesti terlebih dahulu memulakan penterjemah, dan kemudian anda boleh mencapai interaksi dengan melaksanakan rentetan, fail, atau memanggil fungsi tertentu. 1. Inisialisasi penterjemah dengan py_initialize () dan tutupnya dengan py_finalize (); 2. Jalankan kod rentetan atau pyrun_simplefile dengan pyrun_simplefile; 3. Modul import melalui pyimport_importmodule, dapatkan fungsi melalui pyobject_getattrstring, bina parameter py_buildvalue, panggil fungsi dan proses kembali

FunctionHidingInC yang berlaku slswhenaderivedclassdefinesafunctionwiththesamenamameasabaseclassfunction, makethebaseversioninaccessiblethroughthederivedclass.thishappenswhenthenthebasefunctionis'tvirtualorsignaturesdon'tmatchforoverriding, andnousingdechlorover

Dalam C, jenis POD (Plainolddata) merujuk kepada jenis dengan struktur mudah dan serasi dengan pemprosesan data bahasa C. Ia perlu memenuhi dua syarat: ia mempunyai semantik salinan biasa, yang boleh disalin oleh memcpy; Ia mempunyai susun atur standard dan struktur memori boleh diramal. Keperluan khusus termasuk: Semua ahli bukan statik adalah awam, tiada pembina atau pemusnah yang ditentukan oleh pengguna, tiada fungsi maya atau kelas asas, dan semua ahli yang tidak statik sendiri adalah pod. Contohnya structpoint {intx; inty;} adalah pod. Kegunaannya termasuk I/O binari, Ceroperabilitas C, Pengoptimuman Prestasi, dan lain -lain. Anda boleh menyemak sama ada jenisnya adalah pod melalui std :: is_pod, tetapi disyorkan untuk menggunakan std :: is_trivia selepas c 11.

Anullpointerinc isaspecialvalueindicatingthatapointerdoesnotpointoanyanyvalidmemorylocation, anditisusedtosafelymanageandcheckpointersbeforedereferencing.1.beforec 11,0ornullwasused,

Di C, terdapat tiga cara utama untuk lulus fungsi sebagai parameter: menggunakan penunjuk fungsi, std :: fungsi dan ekspresi lambda, dan generik templat. 1. Penunjuk fungsi adalah kaedah yang paling asas, sesuai untuk senario mudah atau antara muka C yang serasi, tetapi kebolehbacaan yang lemah; 2. STD :: Fungsi yang digabungkan dengan ekspresi lambda adalah kaedah yang disyorkan dalam moden C, menyokong pelbagai objek yang boleh dipanggil dan jenis selamat; 3. Kaedah generik templat adalah yang paling fleksibel, sesuai untuk kod perpustakaan atau logik umum, tetapi boleh meningkatkan masa penyusunan dan jumlah kod. Lambdas yang menangkap konteks mesti diluluskan melalui fungsi STD :: atau templat dan tidak boleh ditukar terus ke dalam penunjuk fungsi.
