About 106,000 results
Open links in new tab
  1. 一文了解Transformer全貌(图解Transformer)

    Sep 26, 2025 · 网上有关Transformer原理的介绍很多,在本文中我们将尽量模型简化,让普通读者也能轻松理解。 1. Transformer整体结构 在机器翻译中,Transformer可以将一种语言翻译成 …

  2. 如何最简单、通俗地理解Transformer? - 知乎

    Transformer最开始应用于NLP领域的机器翻译任务,但是它的通用性很好,除了NLP领域的其他任务,经过变体,还可以用于视觉领域,如ViT(Vision Transformer)。 这些特点 …

  3. Transformer 和 cnn 是两条差异巨大的路径吗? - 知乎

    Transformer 和 CNN,真的是两条差异巨大的路径吗? 两者设计逻辑不一样,但目标一致——让机器看懂东西 CNN 是图像领域的老炮,靠“局部感知+权值共享”吃饭。 简单说,它专注于看图 …

  4. 挑战 Transformer:全新架构 Mamba 详解

    Sep 23, 2025 · 而就在最近,一名为 Mamba 的架构似乎打破了这一局面。 与类似规模的 Transformer 相比, Mamba 具有 5 倍的吞吐量, 而且 Mamba-3B 的效果与两倍于其规模的 …

  5. 你对下一代Transformer架构的预测是什么? - 知乎

    2. 引入随机化(Randomized Transformer) Transformer巨大的规模使得不管训练还是推理都极具挑战。 然而,很少有人知道的是,引入随机化矩阵算法可以减少Transformer需要的FLOPs。 …

  6. Transformer两大变种:GPT和BERT的差别(易懂版)-2更

    Jul 16, 2025 · Transformer是GPT和BERT的前身。谷歌和OpenAI在自然语言处理技术上的优化,都是基于这个模型。 更多关于的Transformer可以看文章: ChatGPT与Transformer(无公 …

  7. 为什么我还是无法理解transformer? - 知乎

    7 Transformer 的发展 Transformer架构自从发明之后,沿着几条道路快速发展,它模型分Encoder和Decoder两个部分,怎么做成实际的模型是个排列组合问题:只选择Encoder,只 …

  8. 深度学习中“Transformer”怎么翻译为中文? - 知乎

    Transformer 个人觉得不翻译为好。 Transformer按在机器翻译中原意可以翻译为变形器或变换器。但随着Transformer的普及,它已经成为一类以 自注意力 为主要部件的特定模型,其原本在机 …

  9. 当今改进cnn,transformer还有出路吗? - 知乎

    Point transformer v3: Simpler faster stronger 方法: 论文提出Point Transformer V3,通过改进Transformer架构,采用点云序列化和高效的Patch Attention机制,避免了KNN查询和复杂的 …

  10. VAE、GAN 这种生成模型和 transformer 有什么区别? - 知乎

    想认识Transformer以及最火的GPT结构,请移步以下一个答主认为比较清晰易懂的解答: 不妨让我们一起聚焦当下火热的生成式AI的内核——强大的生成模型,看看这种生成和Transformer …