NLP LLM Optimization Project

This project explores state-of-the-art techniques for optimizing input to Large Language Models (LLMs), focusing on reducing token costs while maintaining or improving performance. Techniques include stop-word removal, Named Entity Recognition (NER), keyword extraction, and TF-IDF.

Folder Structure

config/: Configuration files and scripts.
data/: Datasets and data-related documentation.
scripts/: Scripts to run experiments and pipelines.
src/: Source code for preprocessing, optimization techniques, LLM interface, and evaluation.
- optimization_techniques/: Modules for each input optimization method (stop words, NER, TF-IDF, etc).
outputs/: Contains output files generated by scripts, such as test results.

Main Files

requirements.txt: Python dependencies.
.env / .env.example: Environment variable configuration (e.g., API keys).

Usage

Install dependencies: pip install -r requirements.txt
For additional problem force the updates of gensim: pip install --force-reinstall --upgrade scipy gensim
Install the necessary spacy dictionary python -m spacy download en_core_web_sm
Configure your environment variables in .env.
Run experiments using scripts in the scripts/ folder.
Test outputs are also saved to outputs/test_optimization_techniques_output.txt for easier review.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
config		config
data		data
prompts		prompts
sample_data		sample_data
scripts		scripts
src		src
.gitignore		.gitignore
Gemini_requests.ipynb		Gemini_requests.ipynb
README.md		README.md
algorithm_comparison.ipynb		algorithm_comparison.ipynb
context_optimization_analysis.ipynb		context_optimization_analysis.ipynb
download_dataset_test.ipynb		download_dataset_test.ipynb
downloading_test.ipynb		downloading_test.ipynb
explainability_results_review.ipynb		explainability_results_review.ipynb
generate_dataset.py		generate_dataset.py
get_local_llm_results.ipynb		get_local_llm_results.ipynb
requirements.txt		requirements.txt
test_context_optimization_analysis.ipynb		test_context_optimization_analysis.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP LLM Optimization Project

Folder Structure

Main Files

Usage

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

NLP LLM Optimization Project

Folder Structure

Main Files

Usage

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages