ML and AI papers for prompt engineers

Not All LLM Reasoners Are Created Equal (AI summary)

Arian Hosseini, Alessandro Sordoni, Daniel Toyama, Aaron Courville, Rishabh Agarwal

Prompt Engineer • October 19th, 2024

Read more

Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG (AI summary)

Bowen Jin, Jinsung Yoon, Jiawei Han, Sercan O. Arik

Prompt Engineer • October 19th, 2024

Read more

Fact, Fetch, and Reason: A Unified Evaluation of Retrieval-Augmented Generation (AI summary)

Satyapriya Krishna, Kalpesh Krishna, Anhad Mohananey, Steven Schwarcz, Adam Stambler, Shyam Upadhyay, Manaal Faruqui

Prompt Engineer • October 18th, 2024

Read more

ToolGen: Unified Tool Retrieval and Calling via Generation (AI summary)

Renxi Wang, Xudong Han, Lei Ji, Shu Wang, Timothy Baldwin, Haonan Li

Prompt Engineer • October 18th, 2024

Read more

When a language model is optimized for reasoning, does it still show embers of autoregression? An analysis of OpenAI o1 (AI summary)

R. Thomas McCoy, Shunyu Yao, Dan Friedman, Mathew D. Hardy, Thomas L. Griffiths

Prompt Engineer • October 17th, 2024

Read more

Astute RAG: Overcoming Imperfect Retrieval Augmentation and Knowledge Conflicts for Large Language Models (AI summary)

Fei Wang, Xingchen Wan, Ruoxi Sun, Jiefeng Chen, Sercan Ö. Arık

Prompt Engineer • October 17th, 2024

Read more

RATIONALYST: Pre-training Process-Supervision for Improving Reasoning (AI summary)

Dongwei Jiang, Guoxuan Wang, Yining Lu, Andrew Wang, Jingyu Zhang, Chuyu Liu, Benjamin Van Durme, Daniel Khashabi

Prompt Engineer • October 16th, 2024

Read more

Differential Transformer (AI summary)

Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei

Prompt Engineer • October 16th, 2024

Read more

Archon: An Architecture Search Framework for Inference-Time Techniques (AI summary)

Jon Saad-Falcon, Adrian Gamarra Lafuente, Shlok Natarajan, Nahum Maru, Hristo Todorov, Etash Guha, E. Kelly Buchanan, Mayee Chen, Neel Guha, Christopher Ré, Azalia Mirhoseini

Prompt Engineer • October 15th, 2024

Read more

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering (AI summary)

Jun Shern Chan, Neil Chowdhury, Oliver Jaffe, James Aung, Dane Sherburn, Evan Mays, Giulio Starace, Kevin Liu, Leon Maksin, Tejal Patwardhan, Lilian Weng, Aleksander Mądry

Prompt Engineer • October 15th, 2024

Read more

3/55

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55