Prompt Engineer

All authors

A Comprehensive Study of Knowledge Editing for Large Language Models (AI summary)

Ningyu Zhang, Yunzhi Yao, Bozhong Tian, Peng Wang, Shumin Deng, Mengru Wang, Zekun Xi, Shengyu Mao, Jintian Zhang, Yuansheng Ni, Siyuan Cheng, Ziwen Xu, Xin Xu, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Lei Liang, Zhiqiang Zhang, Xiaowei Zhu, Jun Zhou, Huajun Chen

• March 2nd, 2024

Read more

The Unreasonable Effectiveness of Easy Training Data for Hard Tasks (AI summary)

Peter Hase, Mohit Bansal, Peter Clark, Sarah Wiegreffe

• March 2nd, 2024

Read more

On Layer Normalization in the Transformer Architecture (AI summary)

Ruibin Xiong, Yunchang Yang, Di He, Kai Zheng, Shuxin Zheng, Chen Xing, Huishuai Zhang, Yanyan Lan, Liwei Wang, Tie-Yan Liu

• March 2nd, 2024

Read more

LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning (AI summary)

Hongye Jin, Xiaotian Han, Jingfeng Yang, Zhimeng Jiang, Zirui Liu, Chia-Yuan Chang, Huiyuan Chen, Xia Hu

• March 1st, 2024

Read more

Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference (AI summary)

Simian Luo, Yiqin Tan, Longbo Huang, Jian Li, Hang Zhao

• March 1st, 2024

Read more

Layer Normalization (AI summary)

Jimmy Lei Ba, Jamie Ryan Kiros, Geoffrey E. Hinton

• March 1st, 2024

Read more

LLaMA Beyond English: An Empirical Study on Language Capability Transfer (AI summary)

Jun Zhao, Zhihao Zhang, Luhui Gao, Qi Zhang, Tao Gui, Xuanjing Huang

• February 29th, 2024

Read more

Improving language models by retrieving from trillions of tokens (AI summary)

Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen, Laurent Sifre

• February 29th, 2024

Read more

Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models (AI summary)

Asma Ghandeharioun, Avi Caciularu, Adam Pearce, Lucas Dixon, Mor Geva

• February 29th, 2024

Read more

A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO and Toxicity (AI summary)

Andrew Lee, Xiaoyan Bai, Itamar Pres, Martin Wattenberg, Jonathan K. Kummerfeld, Rada Mihalcea

• February 28th, 2024

Read more

40/55

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55

ML and AI papers

Prompt Engineer

A Comprehensive Study of Knowledge Editing for Large Language Models (AI summary)

The Unreasonable Effectiveness of Easy Training Data for Hard Tasks (AI summary)

On Layer Normalization in the Transformer Architecture (AI summary)

LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning (AI summary)

Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference (AI summary)

Layer Normalization (AI summary)

LLaMA Beyond English: An Empirical Study on Language Capability Transfer (AI summary)

Improving language models by retrieving from trillions of tokens (AI summary)

Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models (AI summary)

A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO and Toxicity (AI summary)