Skip to content

GEO 技术讲解与实操指导

GEO论文及摘要

“We evaluate various Generative Engine Optimization methods … on GEO-bench … measured using Position-Adjusted Word Count and Subjective Impression.”
“We propose 9 different Generative Engine Optimization methods … and use 7 subjective impression metrics (prompts public in repo).”
“4 RESULTS … methods consistently outperform baseline … top-performing: Cite Sources / Quotation Addition / Statistics Addition.”
“Combination … best pair (Fluency Optimization + Statistics Addition) > any single method by >5.5%.”
“This is the first work to formalize GEO … with benchmarks/datasets/metrics; and real-world impact on a deployed GE.”

论文把“生成式引擎优化”系统化了:给出方法族(9 类)评测集(GEO-bench)指标(2+7)实验与组合增益以及上线验证。后续的站点改造与评估可直接复用其口径。


1 结论与有效手段

“Our top-performing methods, Cite Sources, Quotation Addition, and Statistics Addition, achieved a relative improvement of 30–40% on Position-Adjusted Word Count and 15–30% on Subjective Impression.”

模型偏好可信、结构化、可验证的内容。三件套最有效:

  • Cite Sources(出处):句后就地给来源/年份/页码;
  • Quotation(引述):短而原的权威原话 + 归属;
  • Statistics(统计):数字配时间/样本/方法
    不必大改版式,把关键信息改写成**可被直接端走的“证据单元”**即可显著抬升“被引用概率与出现位置”。

操作示例

  • 建立证据写作规范参考文献区(直达章节锚点)。
  • Markdown 片段模版:
    md
    **结论**:2025Q2 新增用户 **+18.4%(N=3,412)** [公司年报·2025, p.12]  
    **引述**:“**增长主要来自长尾创作者**” [年报·p.20]  
    **方法**:问卷;样本 N=3,412;时间 2025-04~06

2 组合策略与协同增益

“The best combination (Fluency Optimization and Statistics Addition) outperforming any single GEO strategy by more than 5.5%.”

有证据 + 写得顺 比只堆数据或只润色更容易进答案。模型不仅看“有没有料”,更看“表述清不清楚”。

操作示例

  • 对核心页统一执行“统计补强 + 流畅度润色”的打包迭代。
  • 句式卡片(复制即用):
    md
    结论句:2025Q2 指标X **+4.3pp**(A/B;N=18,205;p<0.05)。  
    解释句:主要由【教程页】改版驱动(表2;2025-07)。

3 评估与汇报口径

“Performance was measured using two metrics: Position-Adjusted Word Count and Subjective Impression.”

别只看点击/排名。要看两件事:

  • 位置加权可见度:内容在答案里越靠前权重越大;
  • 主观印象:相关性/影响力/唯一性/位置/篇幅/点击可能性/材料多样性。

操作示例

  • Python:位置加权可见度(示例实现)
    python
    import re, math
    
    def position_weighted_score(answer_text, domain_patterns):
        # domain_patterns 例:[r"heliki\.com", r"YourSite"]
        sents = re.split(r'(?<=[。!?.!?])\s+', answer_text.strip())
        score = 0.0; total = 0.0
        for i, s in enumerate(sents):
            w = math.exp(-0.15 * i)  # 越靠前权重越高
            if any(re.search(p, s, re.I) for p in domain_patterns):
                score += len(s) * w
            total += len(s) * w
        return score / total if total else 0.0
  • 主观印象:用 1–5 分量表对七维打分,标准化到 0–1,做周报面板(问题集为行,页为列)。

4 长尾站点的机会

“For rank-5 sites, Cite Sources yielded +115.1% visibility; top-ranked decreased −30.3% … highlighting GEO’s potential to democratize the digital space.”

中小站/长尾页用“证据写法”完全有机会在生成式答案里翻盘,这是“以内容说服模型”的通道。

操作建议

  • 先改长尾但高价值主题;把旧文重构为“证据块体”,每段都能被独立摘走。
  • 与同行/机构建立互证外链(直达章节),增强“可验证性网络”。

5 反模式:老 SEO 不灵

“Keyword Stuffing … did not yield improvements and sometimes reduced visibility.”

关键词堆砌可能扣分。模型要“能核验的事实 + 清楚表达”,不是词频。

操作建议

  • 简易巡检脚本(示例):
    bash
    # 检出重复堆词/空话段(示意规则,自行扩展词表)
    grep -R --include="*.md" -nE "(AI写作){3,}|(最好用){3,}|(顶级){3,}" content/
  • 改成“结论句 + 数据行 + 引述 + 来源”的证据化句式。

6 页面结构:把网页改造成“证据台”

“Stylistic changes such as improving fluency and readability … resulted in a significant visibility boost … This suggests GEs value not only content but also information presentation.”

不只看内容对不对,还看你怎么摆放。把页面拆成“可检索 → 可抽取 → 可引用”的结构更吃香。

操作建议

html
<section class="lead">
  <p><strong>一句话结论:</strong> ……</p>
  <ul>
    <li>要点1(可引用一句) <a href="#ev-1">证据</a></li>
    <li>要点2(可引用一句) <a href="#ev-2">证据</a></li>
    <li>要点3(可引用一句) <a href="#ev-3">证据</a></li>
  </ul>
</section>

<section id="ev-1" class="evidence">
  <p class="claim"><strong>结论:</strong> 2025Q2 指标X 上升 <strong>4.3pp</strong>。</p>
  <div class="data">方法:A/B;样本 N=18,205;p&lt;0.05;时间 2025-07。</div>
  <blockquote class="quote">“变化主要由教程页驱动。” <cite>周报·2025-07·表2</cite></blockquote>
  <p class="bounds">适用范围:移动端;地域:中国大陆。</p>
  <a class="source" href="https://example.com/report#table2">数据来源 · 表2</a>
</section>

<section class="refs">
  <ol>
    <li>[1] 公司年报 2025,https://…/annual#p12</li>
    <li>[2] 实验周报 2025-07,https://…/weekly#table2</li>
  </ol>
</section>

<style>
.lead{margin:1rem 0 1.5rem}
.evidence{border:1px solid #eee;border-radius:8px;padding:12px;margin:12px 0}
.claim{font-weight:600}
.data,.bounds{color:#555;font-size:.95rem}
.quote{margin:.5rem 0;color:#333}
.source{display:inline-block;margin-top:.25rem}
</style>

7 句级写作:让每句话都能被端走

“These methods require minimal changes but significantly improve visibility in GE responses.”

不是大修,是句法。把句子打造成“可引用句”。

操作建议

  • 缺“数字三件套”提示(示意):
    python
    import re
    def lacks_triplet(s):
        # 需同时命中:数字、时间、样本/方法(规则可按领域细化)
        has_num   = re.search(r"\d", s)
        has_time  = re.search(r"(20\d{2}|20\d{2}-\d{2})", s)
        has_sample= re.search(r"(N\s*=\s*\d|A/B|p<0\.\d+|样本|调查|实验)", s)
        return not (has_num and has_time and has_sample)
  • 引述长度与引用格式检测:≤ 20 字原句;就地给 [作者 年/页](机构,年份,页)

8 提升怎么量:用论文的分母

“Improvements_i = ((Imps_i(r’) − Imps_i(r)) / Imps_i(r)) × 100 … the selected source remains constant for a particular query across all methods.”

做前后对照时,题和源不换;报相对提升%,口径与论文一致。

操作建议

  • 固定 50–100 个问题集;抓取多个 GE(ChatGPT/Perplexity/Claude)答案;
  • 用上面的函数算位置加权分,输出 “前/后/提升%” CSV 做周报。

9 迭代与治理

“Methods may need to adapt over time as GEs evolve … GEO changes are targeted changes in textual content, not metadata … As context lengths grow, future models can ingest more sources, reducing the impact of search rankings.”

GEO 是长期战,核心在文本证据而非元数据;上下文变长后,排名影响被稀释,证据块更关键。

可执行操作(30/60/90 天路线)

  • D0–30:核心页“证据化”;每页 ≥3 证据卡;页首三要点锚点联动。
  • D31–60:统一做“统计+流畅度”组合 A/B;把增益映射到句式/证据块类型。
  • D61–90:建“引述/数据素材库”;输出可嵌引用的摘要段给合作方,织互证网络

10 收束与定位

“Our work is the first to formalize the important and timely GEO paradigm … a first step toward understanding the impact of generative engines … and the role of GEO.”

GEO 是新范式的底层写作与摆放逻辑。写给谁?——写给会生成答案的模型;目标不是“排名”,而是**“被引用进答案”**。

操作建议

  • 把“证据三件套 + 证据块布局 + 两指标面板”写进编辑 SOP;
  • 工程侧内置“证据卡组件”“参考文献生成器”“锚点校验脚本”;
  • 新稿上线前,自动跑一遍“句级校验(三件套/引述长度/引用格式)”。

点击这里查看完整论文(PDF)