TL;DR Faithful Contouring menggantikan saluran SDF + Marching Cubes yang telah berusia puluhan tahun dengan Faithful Contour Tokens — menyandikan jaring segitiga secara langsung ke dalam token voxel jarang 18-dimensi, tanpa watertighting, tanpa medan jarak. Pure CUDA, 1024³ dalam ~1.4 s, 2048³ di bawah 5 s pada satu H100.
Tahun lalu telah menyaksikan lonjakan kerja generasi 3D — metode seperti Trellis dan Hunyuan3D menduduki puncak penanda aras hampir setiap bulan. Tetapi inilah yang mudah diabaikan: sementara seni bina rangkaian telah berkembang menjadi DiT, Flow Matching, dan Sparse Voxel Transformer, perwakilan 3D yang mendasari masih bergantung pada SDF + Marching Cubes era 1987. Faithful Contouring menawarkan pendekatan yang secara asasnya berbeza terhadap voxelization 3D.
Faithful Contouring (FC), diterima sebagai CVPR 2026 Oral, melangkau watertighting, melangkau pembinaan medan SDF, dan melangkau Marching Cubes sepenuhnya. Sebaliknya, FC menyandikan jaring segitiga secara langsung ke dalam token voxel jarang — perwakilan 3D baru yang mengekalkan topologi, tepi tajam, dan struktur dalaman. Keseluruhan saluran mesh-ke-voxel dilaksanakan sebagai kernel CUDA tulen, menyelesaikan voxelization 1024³ dalam kira-kira 1 saat dan 2048³ dalam masa kurang dari 5 saat pada satu NVIDIA H100.
Mengapa SDF + Marching Cubes Menjadi Halangan dalam Voxelization 3D
Selama bertahun-tahun, hampir setiap kaedah rekonstruksi dan generasi 3D feedforward — DeepSDF, Occupancy Networks, dan baru-baru ini Trellis, Hunyuan3D, Sparc3D, TripoSF — telah mengikuti saluran yang sama:
Mesh mentah → Penukaran kedap air → SDF / UDF → Marching Cubes → Mesh baru
Saluran ini kelihatan serba guna, tetapi setiap tahap memperkenalkan kehilangan maklumat yang tidak remeh:
-
Prapemprosesan kedap air biasanya menggunakan pelebaran ε-ball untuk menutup lubang. Ini menulis semula topologi dan mengubah cangkerang nipis menjadi cangkerang tebal.
-
Pengiraan tanda bergantung pada algoritma global seperti flood-fill atau nombor winding untuk klasifikasi dalam/luar. Ini tidak stabil pada geometri bukan manifold, permukaan terbuka, dan rongga dalaman — dan mereka menentang paralelisme GPU.
-
Pengekstrakan iso-permukaan melalui Marching Cubes melicinkan tepi tajam, memusnahkan struktur dalaman, dan meninggalkan artifak tangga.
Halangan yang lebih praktikal adalah resolusi: kaedah berasaskan SDF yang ada hampir semuanya terhad di bawah 2048³ untuk voxelization 3D, tepat kerana penyebaran tanda global dan kos prapemprosesan kedap air meningkat dengan resolusi. Faithful Contouring direka untuk memintas keseluruhan saluran ini.
![]()
Apa yang Membuat Faithful Contouring Menonjol
Kebanyakan kaedah voxelization 3D mengikuti jalan tetap: mesh ke medan jarak ke iso-permukaan. Faithful Contouring menanyakan soalan yang berbeza:
Bolehkah kita melangkau jalan memutar dari mesh → medan jarak → iso-permukaan, dan sebaliknya mengekstrak titik sauh calon secara langsung di dalam setiap voxel, kemudian menyambungkannya menjadi permukaan berdasarkan hubungan topologi?
Inilah yang dilakukan oleh Faithful Contouring. Ia menyandikan jaring segitiga secara langsung ke dalam satu set token voxel jarang yang dipanggil Faithful Contour Tokens (FCT). Saluran ini mempunyai tiga sifat utama:
- Bebas medan jarak — tiada pengiraan SDF, tiada penentuan tanda diperlukan
- Bebas rendering — tiada penyeliaan rendering boleh dibezakan diperlukan
- Sepenuhnya tempatan — setiap voxel berinteraksi hanya dengan beberapa segitiga yang melaluinya, menjadikannya secara semula jadi selari GPU
Faithful Contouring vs SDF + Marching Cubes
| Sifat | Saluran SDF + Marching Cubes | Faithful Contouring |
|---|---|---|
| Permukaan terbuka / bukan manifold | Mesti kedap air dahulu (kehilangan topologi) | Disokong secara asli |
| Rongga dalaman | Dipadamkan oleh flood-fill | Sepenuhnya dipelihara |
| Tepi tajam / sudut | Dibulatkan oleh MC | Ditangkap secara semula jadi melalui QEF |
| Perwakilan per-voxel | 1 nilai SDF | Token 18-dimensi |
| Penyuntingan / pemasangan | Sukar | Operasi peringkat token langsung |
| Faithful Contouring menyokong permukaan terbuka, geometri bukan manifold, dan rongga dalaman secara asli — ciri-ciri yang hilang dalam kaedah voxelisasi berasaskan SDF semasa pemprosesan prapemprosesan kedap air. |
Bagaimana Faithful Contouring Berfungsi: Saluran Pengekod dan Penyahkod
Saluran Faithful Contouring terdiri daripada Pengekod dan Penyahkod, kedua-duanya dibina sepenuhnya menggunakan operator geometri klasik tanpa komponen yang dipelajari.
![]()
Pengekod: Mesh → FCT
Untuk setiap voxel dalam grid , empat langkah dilaksanakan secara berurutan:
-
Pengesanan Voxel Aktif (SAT) — Menggunakan Teorem Paksi Pemisah merentasi 13 paksi calon, kami menguji sama ada segitiga memotong voxel tertentu. Voxel yang memotong ditandakan sebagai voxel primal aktif.
-
Centroid Persilangan — Algoritma Sutherland–Hodgman memotong setiap segitiga terhadap enam muka voxel untuk menghasilkan poligon cembung , kemudian mengira centroidnya:
Dengan kekonveksan, centroid ini dijamin terletak di dalam voxel. Setiap , dipasangkan dengan normal segitiga asal , membentuk sampel geometri tempatan.
- Pemasangan Anchor (QEF) — Ini adalah langkah teras. Semua sampel dimasukkan ke dalam minimisasi Fungsi Ralat Kuadrik:
Istilah pertama menguatkuasakan konsistensi satah tangen, menggerakkan anchor ke arah persilangan umum semua satah tangen — sebab itulah tepi tajam dan sudut ditangkap secara semula jadi. Istilah kedua menyediakan regularisasi centroid untuk menekan hanyutan di bawah input yang kurang baik. Penyelesaian diberikan dalam bentuk tertutup oleh persamaan normal 3×3:
Normal diselesaikan melalui regularisasi Tikhonov. Keseluruhan penyelesaian adalah sepenuhnya bebas bagi setiap voxel — sebab asas FC berskala kepada 2048³.
Pada resolusi voxel yang lebih rendah, anchor yang diselesaikan QEF masih melekat dengan pasti pada ciri tajam.
- Persilangan Semi-paksi — Persilangan sinar–segitiga Möller–Trumbore dilakukan sepanjang enam arah separuh paksi, menghasilkan pengekodan binari yang digunakan semasa penyahkodan untuk menentukan orientasi muka.
Semua maklumat dibungkus per voxel ke dalam satu baris:
Setiap voxel aktif menduduki 18 dimensi.
Penyahkod: FCT → Mesh
Penyahkodan terdiri daripada dua langkah:
Pengumpulan global — Voxel primal bersebelahan yang berkongsi voxel dual menggabungkan titik anchor mereka untuk menghasilkan set bucu bersatu .
Quad → Tri — Empat anchor dual pada setiap muka primal membentuk sebuah segi empat. Orientasi ditentukan oleh kod semi-paksi, dan segi empat dibahagikan kepada dua segitiga sepanjang diagonal yang meminimumkan penyimpangan normal.
Keseluruhan penyahkodan juga sepenuhnya tempatan — tiada carian global terlibat.
Kejuruteraan: Voxelisasi Sub-Saat Dengan Paralelisme CUDA
Reka bentuk algoritma FC sejajar rapat dengan paralelisme GPU: setiap voxel bergantung hanya pada beberapa segitiga yang memotongnya, penyelesaian QEF adalah persamaan normal 3×3 bentuk tertutup, dan keseluruhan saluran tidak mengandungi operator global. Inilah sebabnya ia berskala kepada 2048³.
Secara khusus, FC mengelakkan proses global berikut: penyebaran komponen bersambung isi banjir, integrasi penuh-mesh nombor lilitan, pengembangan bola-ε untuk kedap air, dan pemprosesan pasca Marching Cubes. Pengiraan setiap voxel sepenuhnya bebas dan memetakan secara langsung kepada benang CUDA. Kami melaksanakan semua operator teras sebagai kernel CUDA tulen — persilangan SAT, pemotongan Sutherland–Hodgman, QEF berbentuk tertutup, dan persilangan separuh paksi Möller–Trumbore — menghapuskan gelung peringkat Python. Penanda aras pada satu NVIDIA H100:
| Resolusi | Voxel Aktif | Encode | Decode | Jumlah |
|---|---|---|---|---|
| 128³ | 71K | 0.27 s | 0.02 s | 0.29 s |
| 256³ | 287K | 0.45 s | 0.06 s | 0.51 s |
| 512³ | 1.1M | 0.52 s | 0.17 s | 0.70 s |
| 1024³ | 4.6M | 0.82 s | 0.61 s | 1.42 s |
| 2048³ | 18.4M | 2.16 s | 2.51 s | 4.68 s |
Nombor utama: 512³ dari hujung ke hujung dalam 0.7 s, 1024³ dalam kira-kira 1.4 s, 2048³ di bawah 5 s. Keseluruhan latensi meningkat kira-kira secara linear dengan kiraan voxel aktif.
Sebagai perbandingan, saluran paip pembinaan semula SDF tradisional berdasarkan pengisian banjir atau nombor penggulungan biasanya memerlukan beberapa minit hingga puluhan minit pada 1024³, dan tidak dapat secara praktikal meningkat kepada 2048³ disebabkan oleh overhead memori dan pengiraan penyebaran tanda global. FC bukan sahaja berjalan secara langsung pada 2048³ tetapi mengekalkan latensi hujung ke hujung pada skala saat.
Keputusan Eksperimen
Ketepatan Perwakilan
Pada subset mencabar dari ABO dan Objaverse:
| Kaedah | Resolusi | HD ↓ | CD (G→P) ↓ | F-score (0.01) ↑ |
|---|---|---|---|---|
| UDF | 1024 | Tinggi (artifak lapisan berganda) | Tinggi | Rendah |
| Flood-fill SDF | 1024 | Tinggi (permukaan mengembung) | Tinggi | Sederhana |
| FlexiCubes | 1024 | Sederhana | Sederhana | Sederhana |
| FC | 1024 | 0.11 × 10⁻² | 0.01 × 10⁻⁴ | 99.71 |
| FC | 2048 | 0.11 × 10⁻² | < 0.01 × 10⁻⁴ | 99.99 |
FC kini adalah satu-satunya perwakilan voxel yang berjalan secara langsung pada 2048³, dengan kesalahan jarak stabil pada skala 10⁻⁵.
![]()
Pembinaan Semula VAE
Untuk mengesahkan FCT sebagai perwakilan pembelajaran mendalam, kami membina VAE mod dua menggunakan konvolusi 3D jarang ditambah perhatian ringan, menyokong dua mod input: (a) pemampatan diri FCT → FCT, dan (b) awan titik → FCT.
Dibandingkan dengan Trellis, SparseFlex, dan Sparc3D pada penanda aras Dora dan Toys4k:
- Jarak Chamfer dikurangkan kira-kira 93%
- F-score diperbaiki kira-kira 35%
Secara khusus, FC-VAE pada resolusi 512³ sudah melebihi pembinaan semula SparseFlex / Sparc3D pada 1024³, menunjukkan bahawa perwakilan tanpa kehilangan dapat mengurangkan beban pembelajaran secara signifikan pada rangkaian hiliran.
![]()
Penyuntingan dan Komposisi Dengan Token Kontur Setia
FCT adalah perwakilan voxel jarang berasaskan token, yang bermaksud semua operasi peringkat voxel dipindahkan secara langsung kepada token. FCT menyokong empat kategori operasi peringkat token langsung:
![]()
- Penapisan — Pemancaran sinar mengira keterlihatan; voxel tersembunyi dalaman dan token mereka dikeluarkan oleh ambang.
- Tekstur — Saluran tambahan ditambahkan kepada token 18D, mengikat atribut tekstur kepada sauh.
- Manipulasi — Putaran dan ubah bentuk tak linear bertindak secara langsung pada sauh, diikuti oleh pengiraan semula sambungan.
- Pembahagian & Perhimpunan — Penggabungan menggunakan pengagregatan purata pada kedudukan sauh dan pengagregatan maksimum untuk orientasi; pemisahan menyalin dan memisahkan kumpulan token melalui topeng geometri atau semantik.
Ini menjadikan FCT bukan sahaja perwakilan input tetapi juga bekas token geometri yang menyokong komposisi, penyuntingan, tekstur, dan pemindahan gaya — selaras dengan fasa seterusnya penjanaan 3D: peringkat bahagian, boleh diedit, dan multimodal.
Sumber Terbuka dan Kebolehulangan
Kod ini sepenuhnya sumber terbuka. Bermula dari v1.5, pangkalan kod telah diubah suai kepada Python tulen + Atom3d, dengan kernel CUDA diedarkan sebagai roda pra-dikompaun — tiada alat rantai C++ tempatan diperlukan. Kami menyediakan kedua-dua persekitaran satu klik Pixi dan pemasangan pip tradisional, meliputi segala-galanya daripada pengeluaran semula penyelidikan kepada integrasi pengeluaran.
Repositori ini termasuk:
- Codec FCT lengkap (FCTEncoder / FCTDecoder), menyokong resolusi sewenang-wenangnya dari 128³ hingga 2048³
- Backend persilangan mesh dipercepatkan BVH Atom3d
- Skrip demo dan mesh sampel (icosphere, pirateship, dll.) — sedia untuk dijalankan dan membandingkan keluaran GLB secara langsung
- Kod latihan FCT-VAE dan berat model penyebaran (akan datang)
Repositori: github.com/Luo-Yihao/FaithC
Ringkasan
Apa yang dilakukan oleh Faithful Contouring boleh diringkaskan dalam satu ayat:
Ia memindahkan lapisan perwakilan 3D dari paradigma medan jarak ke paradigma token kontur.
Medan jarak dan Marching Cubes bermula sejak tahun 1980-an. Kontemporari 2D mereka telah lama digantikan oleh splines, rasterizer font SDF, dan rendering neural merentasi pelbagai kitaran iterasi. Di sisi 3D, penggandengan mendalam antara saluran paip dan set data serta rangka kerja penilaian yang ditetapkan telah lama menghalang pemikiran semula sistematik terhadap lapisan perwakilan itu sendiri. FC menawarkan asas baru: boleh diselesaikan dalam bentuk tertutup, mesra GPU, dan boleh diskalakan hingga 2048³ — secara asli mengendalikan permukaan terbuka dan geometri bukan manifold, sepenuhnya memelihara struktur dalaman dan tepi tajam, semuanya dalam 18 dimensi per voxel.
Satu pengesahan yang patut diberi perhatian: tidak lama selepas kerja ini diumumkan, Microsoft mengeluarkan TRELLIS.2 pada Januari 2026, memperkenalkan O-Voxel — perwakilan voxel jarang tanpa medan yang juga memintas medan SDF / penghunian dan mengekod topologi sewenang-wenangnya (termasuk permukaan bukan manifold dan terbuka) secara langsung melalui mesh dua. Dua laluan bebas yang bertemu pada kesimpulan yang serupa dalam jangka masa yang sempit mencadangkan bahawa iso-permukaan bukan lagi satu-satunya pilihan untuk perwakilan 3D.
Keterbatasan
Versi semasa FC mempunyai beberapa keterbatasan yang jelas:
- Persilangan diri yang teruk dan struktur berlapis rapat — Apabila beberapa permukaan nipis berselang-seli atau menekan bersama pada skala sub-voxel, sampel dalam satu voxel datang dari helaian yang berbeza. Sauh yang diselesaikan QEF menjadi samar dan menunjukkan pergeseran tempatan.
- Kapasiti VAE yang kurang dimanfaatkan — FCT-VAE semasa mengadopsi tulang belakang konvolusi jarang + perhatian tempatan dari Sparc3D / SparseFlex. Kapasiti pemodelannya untuk cabang yang sangat halus, hiasan padat, dan struktur sangat tidak teratur lain masih mempunyai ruang untuk penambahbaikan.
- Kemerosotan ketajaman melalui penyahkodan — FCT yang dinyahkod melalui VAE menunjukkan sedikit kehilangan ketajaman dan kelancaran berbanding pemasangan langsung, yang melekat pada pemampatan laten. Ini juga menunjukkan keperluan untuk penjajaran yang lebih halus antara perwakilan token dan dimensi laten.
Apa Seterusnya: Pratonton Vision 2
Dalam Faithful Contouring 2.0 yang akan datang, kami melanjutkan FCT kepada bentuk berbilang sauh — satu voxel tidak lagi terhad kepada satu sauh tetapi boleh menampung pelbagai sauh untuk mewakili struktur persilangan yang kompleks. Ini akan secara sistematik meningkatkan prestasi FC pada persilangan diri, geometri berlapis rapat, dan cangkerang nipis bersarang, sambil menyediakan rangkaian hiliran dengan maklumat geometri tempatan yang lebih terperinci. Nantikan.
Petikan
@inproceedings{luo2026faithfulcontouring,
title = {Faithful Contouring: Near-Lossless 3D Voxel Representation Free from Iso-surface},
author = {Luo, Yihao dan He, Xianglong dan Pan, Chuanyu dan Chen, Yiwen dan Wu, Jiaqi
dan Li, Yangguang dan Ouyang, Wanli dan Hu, Yuanming dan Yang, Guang dan Yap, ChoonHwai},
booktitle = {CVPR},
year = {2026}
}Cukup dengan SDF + Marching Cubes? Masa untuk mengembalikan geometri — dengan setia.
CVPR 2026 Oral · arXiv 2511.04029 · GitHub: Luo-Yihao/FaithC
Yihao Luo, Imperial College London — y.luo23@imperial.ac.uk


