Jengamon/crafting_interpreters - Change XV3B7TJOX7HXDITDNLXF3IJHB67Q3JY5DCWOSP2TAY45T76SMALQC

Work on scanner

Created by Jengamon on March 27, 2023

XV3B7TJOX7HXDITDNLXF3IJHB67Q3JY5DCWOSP2TAY45T76SMALQC

Dependencies

[2] FLD3LMMKYONE4I6TMVNQOT3QT2QGGQNXPGXLX6RYDUOCLP7JTCBAC

In channels

main

Change contents

Replacement in jloxz/src/main.zig at line 66 [2.69]
B:BD[2.2112] → [2.2112:2151]
```
    // defer allocator.free(contents);
```
[2.2112]
[2.2151]
```
    defer allocator.free(contents);
```
Replacement in jloxz/src/main.zig at line 71 [2.69]
B:BD[2.2247] → [2.2247:2288]
```
    std.debug.print("{s}\n", .{source});
```
[2.2247]
[2.2288]
```
    // std.debug.print("{s}\n", .{source});
```

Replacement in jloxz/src/main.zig at line 73 [2.69]

B:BD[2.2289] → [2.2289:2336]

    var scanner = try Scanner.init(allocator);

[2.2289]

[2.2336]

    var scanner = try Scanner.init(allocator, source);

Replacement in jloxz/src/main.zig at line 75 [2.69]

B:BD[2.2364] → [2.2364:2596]

    for (try scanner.scanTokens()) |token| {
        std.debug.print("{d}:{d} \'{?s}\' : {any}\n", .{
            token.source_start,
            token.source_end(),
            token.data,
            token.token_type,
        });

[2.2364]

[2.2596]


    const tokens = try scanner.scanTokens();
    defer {
        for (tokens) |token| {
            allocator.free(token.lexeme);
        }
        allocator.free(tokens);
    }
    for (tokens) |token| {
        std.debug.print("[line {d}] {any}\n", .{ token.line, token });

Insertion in jloxz/src/Token.zig at line 4 [2.2920]
[2.3090]
[2.3090]
```
const std = @import("std");
```

Replacement in jloxz/src/Token.zig at line 9 [2.2920]

B:BD[2.3129] → [2.3129:3149]

const Type = enum {

[2.3129]

[2.3149]

pub const Type = enum {
    // Single-char tokens
    left_paren,
    right_paren,
    left_brace,
    right_brace,
    comma,
    dot,
    minus,
    plus,
    semicolon,
    slash,
    star,
    // one or two char tokens
    bang,
    bang_equal,
    equal,
    equal_equal,
    greater,
    greater_equal,
    less,
    less_equal,
    // literals

Insertion in jloxz/src/Token.zig at line 35 [2.2920]

[2.3165]

    string,
    number,
    // keywords
    kw_and,
    kw_class,
    kw_else,
    kw_false,
    kw_fun,
    kw_for,
    kw_if,
    kw_nil,
    kw_or,
    kw_print,
    kw_return,
    kw_super,
    kw_this,
    kw_true,
    kw_var,
    kw_while,
    eof,

Insertion in jloxz/src/Token.zig at line 59 [2.2920]
[2.3169]
[2.3169]
```
pub const Literal = union {
    number: f32,
};
```

Replacement in jloxz/src/Token.zig at line 64 [2.2920]

B:BD[2.3187] → [2.3187:3274]

data: ?[]const u8,
source_start: u32, // Source end should be automatically calculated

[2.3187]

[2.3274]

lexeme: []const u8,
line: u32,
// For the jlox interpreter, use a tagged union for literals
literal: ?Literal,

Replacement in jloxz/src/Token.zig at line 69 [2.2920]

B:BD[2.3275] → [2.3275:3398]

pub fn source_end(self: *const Self) u32 {
    return self.source_start + @truncate(u32, (self.data orelse &[_]u8{}).len);

[2.3275]

[2.3398]

pub fn format(value: Self, comptime fmt: []const u8, options: std.fmt.FormatOptions, writer: anytype) !void {
    _ = fmt;
    _ = options;
    try writer.print("{any} '{s}' {?any}", .{ value.token_type, value.lexeme, value.literal });

Insertion in jloxz/src/Scanner.zig at line 2 [2.3437]
[2.3466]
[2.3466]
```
const Error = @import("./Error.zig");
```

Insertion in jloxz/src/Scanner.zig at line 4 [2.3437]

[2.3504]

const Normalizer = @import("ziglyph").Normalizer;
const Grapheme = @import("ziglyph").Grapheme;
const CodePoint = @import("ziglyph").CodePoint;
const GraphemeIterator = Grapheme.GraphemeIterator;

Insertion in jloxz/src/Scanner.zig at line 12 [2.3437]
[2.3558]
[2.3558]
```
source: []Grapheme,
start: u32,
index: u32,
line: u32,
```

Replacement in jloxz/src/Scanner.zig at line 17 [2.3437]

B:BD[2.3559] → [2.3559:3649]

pub fn init(allocator: std.mem.Allocator) !Self {
    return .{ .allocator = allocator };

[2.3559]

[2.3649]

pub fn init(allocator: std.mem.Allocator, source: []const u8) !Self {
    var normalizer = try Normalizer.init(allocator);
    defer normalizer.deinit();
    var got_nfkc = try normalizer.nfkc(allocator, source);
    defer got_nfkc.deinit();
    var graphemes = std.ArrayList(Grapheme).init(allocator);
    defer graphemes.deinit();
    var iter = try GraphemeIterator.init(got_nfkc.slice);
    while (iter.next()) |grapheme| {
        try graphemes.append(grapheme);
    }
    return .{
        .allocator = allocator,
        .source = try graphemes.toOwnedSlice(),
        .line = 1,
        .start = 0,
        .index = 0,
    };

Replacement in jloxz/src/Scanner.zig at line 42 [2.3437]
B:BD[2.3686] → [2.3686:3700]
```
    _ = self;
```
[2.3686]
[2.3700]
```
    self.allocator.free(self.source);
```

Replacement in jloxz/src/Scanner.zig at line 46 [2.3437]

B:BD[2.3751] → [2.3751:3883]

    _ = self;
    return &[_]Token{.{
        .token_type = .identifier,
        .data = "deez",
        .source_start = 0,
    }};

[2.3751]

[2.3883]

    var list = std.ArrayList(Token).init(self.allocator);
    defer {
        for (list.items) |token| {
            self.allocator.free(token.lexeme);
        }
        list.deinit();
    }
    while (!self.isAtEnd()) {
        self.start = self.index;
        try self.scanToken(&list);
    }
    try list.append(.{
        .token_type = .eof,
        .lexeme = "",
        .line = self.line,
        .literal = null,
    });
    return list.toOwnedSlice();
}
fn isAtEnd(self: *Self) bool {
    return self.index >= self.source.len;
}
inline fn peek(self: *Self) Grapheme {
    return self.source[self.index];
}
fn advance(self: *Self) Grapheme {
    const grapheme = self.source[self.index];
    self.index += 1;
    return grapheme;
}
fn addToken(self: *Self, list: *std.ArrayList(Token), token_type: Token.Type, literal: ?Token.Literal) !void {
    var text = std.ArrayList(u8).init(self.allocator);
    defer text.deinit();
    for (self.source[self.start..self.index]) |grapheme| {
        try text.appendSlice(grapheme.bytes);
    }
    try list.append(.{
        .token_type = token_type,
        .literal = literal,
        .lexeme = try text.toOwnedSlice(),
        .line = self.line,
    });
}
fn codepointize(grapheme: Grapheme) u21 {
    const bytes = grapheme.bytes;
    switch (bytes.len) {
        0 => unreachable,
        1 => return @as(u21, bytes[0]),
        else => @panic("Unsupported grapheme length"),
    }
}
fn scanToken(self: *Self, list: *std.ArrayList(Token)) !void {
    const c = self.advance();
    // We do not support combining characters. But we don't have to,
    // as we have already merged necessary characters using the Unicode NFKC process, so...
    const cp = codepointize(c);
    switch (cp) {
        '(' => try self.addToken(list, .left_paren, null),
        else => {
            try Error.report(self.line, "lexer", "Unknown codepoint {u}", .{cp});
            return error.UnknownCharacter;
        },
    }

Replacement in jloxz/src/Error.zig at line 3 [2.3920]
B:BD[2.3950] → [2.3950:3977]
```
const ErrorType = error{};
```
[2.3950]
[2.3977]
```
const ErrorType = error{
    UnknownCharacter,
};
```

Replacement in jloxz/src/Error.zig at line 12 [2.3920]

B:BD[2.4189] → [2.4189:4256]

    const bw = std.io.bufferedWriter(std.io.getStdErr().writer());

[2.4189]

[2.4256]

    var bw = std.io.bufferedWriter(std.io.getStdErr().writer());

Replacement in jloxz/src/Error.zig at line 14 [2.3920]

B:BD[2.4288] → [2.4288:4405]

    stderr.print("[line {d}] Error ({s}): ", .{ line, where });
    stderr.print(fmt, args);
    try stderr.flush();

[2.4288]

[2.4405]

    try stderr.print("[line {d}] Error ({s}): ", .{ line, where });
    try stderr.print(fmt, args);
    _ = try stderr.write("\n");
    try bw.flush();

Work on scanner

Dependencies

In channels

Change contents

Replacement in jloxz/src/main.zig at line 66 [2.69]

Replacement in jloxz/src/main.zig at line 71 [2.69]

Replacement in jloxz/src/main.zig at line 73 [2.69]

Replacement in jloxz/src/main.zig at line 75 [2.69]

Insertion in jloxz/src/Token.zig at line 4 [2.2920]

Replacement in jloxz/src/Token.zig at line 9 [2.2920]

Insertion in jloxz/src/Token.zig at line 35 [2.2920]

Insertion in jloxz/src/Token.zig at line 59 [2.2920]

Replacement in jloxz/src/Token.zig at line 64 [2.2920]

Replacement in jloxz/src/Token.zig at line 69 [2.2920]

Insertion in jloxz/src/Scanner.zig at line 2 [2.3437]

Insertion in jloxz/src/Scanner.zig at line 4 [2.3437]

Insertion in jloxz/src/Scanner.zig at line 12 [2.3437]

Replacement in jloxz/src/Scanner.zig at line 17 [2.3437]

Replacement in jloxz/src/Scanner.zig at line 42 [2.3437]

Replacement in jloxz/src/Scanner.zig at line 46 [2.3437]

Replacement in jloxz/src/Error.zig at line 3 [2.3920]

Replacement in jloxz/src/Error.zig at line 12 [2.3920]

Replacement in jloxz/src/Error.zig at line 14 [2.3920]