lambda-feedback
diff --git a/‎.DS_Store‎
0 Bytes b/‎.DS_Store‎
0 Bytes
diff --git a/‎educational_material/.DS_Store‎
0 Bytes b/‎educational_material/.DS_Store‎
0 Bytes
diff --git a/‎educational_material/main.py‎
Lines changed: 23 additions & 1 deletion b/‎educational_material/main.py‎
Lines changed: 23 additions & 1 deletion
diff --git a/‎evaluation_function/dev.json‎
Lines changed: 4 additions & 2 deletions b/‎evaluation_function/dev.json‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎evaluation_function/models/shannon_letters_ngram.py‎
Lines changed: 55 additions & 12 deletions b/‎evaluation_function/models/shannon_letters_ngram.py‎
Lines changed: 55 additions & 12 deletions
@@ -25,6 +25,26 @@ def plot_letter_histogram(show_plots: bool=False, media_dir: Path=None):
     else:
         print(f"Plot saved to {out_path}.")  
 
+def plot_wordlength_histogram(show_plots: bool=False, media_dir: Path=None):
+    """Plot a histogram from norvig_word_frequencies.csv."""
+    csv_path = Path(__file__).parent.parent / "evaluation_function" / "models" / "storage" / "norvig_word_frequencies.csv"
+    df = pd.read_csv(csv_path)
+
+    df = df.sort_values(by="Percent", ascending=False)
+
+    plt.bar(df["wordLength"], df["Percent"], color="skyblue", edgecolor="black")
+    plt.xlabel("Word length")
+    plt.ylabel("Frequency")
+    plt.tight_layout()
+
+    out_path = media_dir / "word_histogram.png"
+    plt.savefig(out_path, dpi=150, bbox_inches="tight")
+    if show_plots:
+        print(f"Plot saved to {out_path}, displaying plot now.")
+        plt.show()
+    else:
+        print(f"Plot saved to {out_path}.")  
+
 def plot_neural_network_results(show_plots: bool=False, media_dir: Path=None):
     """Plot the results of a neural network model against the data.
 
@@ -70,5 +90,7 @@ def plot_neural_network_results(show_plots: bool=False, media_dir: Path=None):
     args = parser.parse_args()
     media_dir = Path(__file__).parent / "media"
     media_dir.mkdir(exist_ok=True)
+    #plot_letter_histogram(show_plots=args.show_plots, media_dir=media_dir)
+    plot_wordlength_histogram(show_plots=args.show_plots, media_dir=media_dir)
     #plot_neural_network_results(show_plots=args.show_plots, media_dir=media_dir)
-    plot_letter_histogram(show_plots=args.show_plots, media_dir=media_dir)
+    
@@ -16,8 +16,10 @@
     "response": 6,
     "answer": 800,
     "model": "shannon_letters_ngram",
+    "mode": "single",
     "word_count": "random",
-    "context_window": 5
+    "context": "ate",
+    "context_window": 3
   },
   "shannon_words_build": {
     "response": "the general sweetness",
@@ -30,7 +32,7 @@
     "response": "the general sweetness",
     "answer": 2,
     "model": "shannon_words_ngram",
-    "word_count": 12,
+    "word_count": 10,
     "context_window": 3,
     "dev": true
   },
 
@@ -49,8 +49,9 @@ def sample_ngram(lookups, n, prefix="", k=1):
     return random.choices(data["keys"], weights=data["freqs"], k=k)
 
 
-def generate_word(N,n) -> str: # N = max letters, n = context window (as in, n-gram)
-    lookups = read_multingram_csv(LETTERS_PATH)
+def generate_word(lookups, N,n, printing=0) -> str: # N = max letters, n = context window (as in, n-gram)
+    """Generate a random word using n-gram model up to N letters."""
+    #lookups = read_multingram_csv(LETTERS_PATH)
     N_max=N
     samples = {}
     samples[1] = sample_ngram(lookups, n=1, prefix="", k=1)[0]
@@ -77,33 +78,75 @@ def generate_word(N,n) -> str: # N = max letters, n = context window (as in, n-g
 
     return samples[N_max]
 
+def generate_single_letter(lookups, n, prefix="") -> list:
+    """Return top 5 most probable next letters for a given prefix."""
+    # Auto-trim prefix if too long
+    expected_prefix_len = max(0, n - 1)
+    if len(prefix) > expected_prefix_len:
+        prefix = prefix[-expected_prefix_len:]  # keep last n-1 chars
+    print(prefix)
+    print(prefix in lookups.get(n, {}))
+    if prefix not in lookups.get(n, {}):
+        return []
+
+    data = lookups[n][prefix]
+    freqs = data["freqs"]
+    keys = data["keys"]
+    total = sum(freqs)
+    probs = [f / total for f in freqs]
+
+    pairs = sorted(zip(keys, probs), key=lambda x: x[1], reverse=True)
+    return pairs[:5]
+
 def run(response, answer, params:Params) -> Result:
-    output=[]
+    mode = params.get("mode", "production")
+    context_window = params.get("context_window", 3)
+    printing = params.get("printing", 0)
+
+    if printing:
+        print("#### Reading n-gram data ####")
+    lookups = read_multingram_csv(LETTERS_PATH)
+
+    result = Result(True)
 
+    # === SINGLE MODE ===
+    if mode == "single":
+        prefix = params.get("context", "he").upper()
+        top5 = generate_single_letter(lookups, context_window, prefix)
+        if not top5:
+            feedback = f"No data found for prefix '{prefix}' and n={context_window}."
+        else:
+            feedback_lines = []
+            for k, p in top5:
+                feedback_lines.append(f"{k[:-1]} | {k[-1]} - {p:.0%}")
+            feedback = "<br>".join(feedback_lines)
+
+        result.add_feedback("general", feedback)
+        return result
+    
+    # === PRODUCTION MODE ===
     print("#### Getting data ####")
     data = csv_to_lists(WORD_LENGTHS_PATH)
 
     print("#### Generating word lengths ####")
-    word_lengths = {}
-    word_lengths["tokens"] = [row[0] for row in data]
-    word_lengths["weights"] = [row[1] for row in data]
+    word_lengths = {
+        "tokens": [row[0] for row in data],
+        "weights": [row[1] for row in data],
+    }
 
-    print("#### Getting context window ####")
     word_count = params.get("word_count", 10)
     response_used = isinstance(response, int) and response > 1
-    context_window = response if response_used else params.get("context_window", 3)
 
     if word_count == "random":
         word_count = random.randint(3,15)
 
     print("#### Getting output ####")
-    for i in range(word_count):
+    output=[]
+    for _ in range(word_count):
         k=int(random.choices(word_lengths["tokens"],weights=word_lengths["weights"],k=1)[0]) 
-        output.append(generate_word(k,context_window))
+        output.append(generate_word(lookups,k,context_window))
 
     print("#### Generating Feedback ####")
-
-    result = Result(True)
     preface = 'Context window: '+str(context_window)+', Word count: '+str(word_count)+'. Output: <br>'
     result.add_feedback("general", preface + ' '.join(output))
     if response_used: